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1. Aquéjugamos 


¿De qué trata la teoría de juegos? 


Mientras mi esposa se ausentaba por un día para 
asistir a una pequeña y agradable conferencia en la 
Toscana, tres mujeres jóvenes me invitaron a comer 
con ellas. Cuando me senté, una dijo con voz seduc- 
tora: «enséñanos a jugar al juego del amor», pero re- 
sultó que lo único que querían era consejo sobre 
cómo lidiar con novios italianos. Sigo pensando que 
se equivocaban al rechazar mis recomendaciones es- 
tratégicas, pero acertaron al dar por sentado que el 
cortejo es uno de los muchos tipos de juegos en los 
que participamos en la vida real. 

Los conductores que maniobran en medio de un 
tráfico denso juegan a un juego de conducción. Los 
buscadores de gangas que pujan en eBay juegan a un 
juego de subastas. Una empresa y un sindicato que 
negocian los salarios del año siguiente juegan a un 
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juego de negociación. Cuando los candidatos en- 
frentados escogen su programa en unas elecciones, 
juegan a un juego político. El propietario de una 
tienda de comestibles que decide el precio de los ce- 
reales para hoy juega a un juego económico. En re- 
sumen, cuando dos seres humanos interactúan, se 
está jugando a un juego. 

Marco Antonio y Cleopatra jugaron al cortejo a 
gran escala. Bill Gates se hizo inmensamente rico 
gracias al juego del software informático. El juego 
que llevaron a cabo Adolf Hitler y Iosif Stalin acabó 
con una parte significativa de la población mundial. 
Kruschev y Kennedy también desarrollaron un jue- 
go durante la crisis de los misiles cubanos que po- 
dría habernos borrado del mapa por completo. 

Con un campo de aplicación tan amplio, la teoría 
de juegos sería la panacea universal si siempre pu- 
diera predecir de qué modo jugará la gente a los 
juegos en los que en gran medida consiste la vida 
social. Sin embargo, esta teoría no es capaz de solu- 
cionar todos los problemas del mundo, porque sólo 
funciona cuando los individuos juegan racional- 
mente. Por consiguiente, no puede predecir el com- 
portamiento de unos adolescentes enfermos de 
amor como Romeo y Julieta, o de dementes como 
Hitler o Stalin. No obstante, la gente no siempre se 
comporta irracionalmente, y, por lo tanto, estudiar 
lo que pasa cuando usan sus cerebros para pensar 
no es una pérdida de tiempo. La mayoría de noso- 
tros al menos intentamos gastar nuestro dinero con 
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sensatez; y no lo hacemos demasiado mal la mayor 
parte del tiempo o la teoría económica no funcio- 
naría en absoluto. 

Aun cuando las personas no hayan pensado en 
todo de antemano, ello no significa que necesaria- 
mente se comporten de una manera irracional. La 
teoría de juegos ha tenido algunos éxitos significati- 
vos a la hora de explicar el comportamiento de las 
arañas y los peces, de los que en absoluto puede con- 
siderarse que piensen. Estos animales carentes de in- 
teligencia acaban por comportarse como si fueran 
racionales, porque los rivales cuyos genes los pro- 
gramaban para comportarse irracionalmente ya se 
han extinguido. De un modo similar, las empresas 
no siempre están dirigidas por grandes intelectos, 
pero el mercado a menudo es igual de despiadado 
que la naturaleza a la hora de eliminar del medio a 
los no aptos. 


¿Funciona la teoría de juegos? 


A pesar de sus éxitos teóricos, los hombres de nego- 
cios pragmáticos solían despreciar la teoría de jue- 
gos por considerarla una rama intelectual más de las 
ciencias sociales, pero cambiaron de idea de la noche 
a la mañana después de que el gobierno estadouni- 
dense decidiera subastar las licencias de varias fre- 
cuencias de radio para su uso en redes de telefonía 
móvil. 
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A falta de expertos autorizados que se ocuparan 
de ello, el consejo de los expertos en teoría de juegos 
se reveló decisivo para determinar el diseño de las 
reglas de las subastas que se emplearon. El resultado 
fue que el contribuyente estadounidense consiguió 
unos beneficios de 20.000 millones de dólares, más 
del doble de la predicción ortodoxa. Posteriormente 
consiguió todavía más al subastar en Gran Bretaña 
varias licencias de comunicaciones, de la que fui res- 
ponsable; obtuvimos un total de 35.000 millones de 
dólares en una sola subasta. A consecuencia de ello, 
¡la revista Newsweek me definió como un despiada- 
do economista jugador de Póquer que había des- 
truido la industria de las telecomunicaciones! 

Como se demostró, la industria de las telecomu- 
nicaciones no fue destruida. Tampoco era en abso- 
luto despiadado hacer que los peces gordos de la in- 
dustria de las telecomunicaciones pagaran por sus 
licencias lo que creyeran que valían; especialmente 
cuando el dinero se empleó en hospitales para aque- 
llos que no pueden costearse asistencia médica pri- 
vada. En cuanto al Póquer, hace al menos veinte 
años que no juego más que unos céntimos. En lo 
único que acertó Newsweek es que la teoría de juegos 
realmente funciona cuando es aplicada por perso- 
nas que saben lo que hacen. No solamente funciona 
en economía, sino también en biología evolutiva 
y en ciencia política. Con mi reciente libro Natural 
Justice, incluso escandalicé a los filósofos de la moral 
al emplear la teoría de juegos para hablar de ética. 
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Juegos básicos 


Cada nueva subasta de telecomunicaciones de gran 
nivel debe diseñarse de acuerdo con las circunstan- 
cias en las que se va a realizar. No puede aplicarse un 
diseño prefabricado, como descubrió el gobierno es- 
tadounidense cuando contrató a Sotheby's para su- 
bastar un montón de repetidores por satélite. Pero 
tampoco pueden incluirse todos los detalles de un 
nuevo mercado de las telecomunicaciones en un mo- 
delo matemático. Diseñar una subasta de telecomu- 
nicaciones es, por consiguiente, tanto un arte como 
una ciencia. Se hace una extrapolación a partir de 
modelos simples que imitan lo que parecen ser las ca- 
racterísticas estratégicas esenciales de un problema. 

Intento hacer lo mismo en este libro, por lo que 
no utilizo términos del álgebra y solamente un mí- 
nimo de jerga técnica, que se centra únicamente en 
juegos básicos (toy games) y deja de lado todos los 
complicados pormenores de la vida real. Sin embar- 
go, la mayoría de la gente se da cuenta de que incluso 
los juegos básicos les ofrecen mucho sobre lo que re- 
flexionar. 


Conflicto y cooperación 
La mayoría de juegos de este libro tienen solamente 


dos jugadores, llamados Alice y Bob. El primero que 
vamos a ver es el Juego de las Monedas. 


14 LA TEORIA DE JUEGOS. UNA BREVE INTRODUCCION 


Bob 


cara cruz cara Cruz 
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cruz cruz 


Estrategias de Alice Estrategias de Bob 


FIGURA 1. Problema de decisión de Alice y Bob en el Juego de 
las Monedas. 


Sherlock Holmes y el malvado profesor Moriarty 
jugaban a las monedas de camino a su confronta- 
ción final en las cascadas de Reichenbach. Holmes 
tenía que decidir en qué estación bajarse del tren. 
Moriarty tenía que decidir en qué estación esperar. 
Un equivalente en la vida real se desarrollaría entre 
contables deshonestos y sus auditores. Los primeros 
deciden cuándo defraudar y los segundos cuándo 
inspeccionar los libros. 

En nuestra versión en forma de modelo básico, 
Alice y Bob muestran una moneda cada uno. Alice 
gana si ambas monedas muestran la misma cara. 
Bob gana si muestran caras diferentes. Por consi- 
guiente, Alice y Bob tienen dos estrategias cada uno, 
cara o cruz. La Figura 1 muestra quién gana y quién 
pierde en todas las combinaciones entre estrategias. 
Estos resultados son los pagos que reciben los parti- 
cipantes en el juego. Los iconos de pulgares hacia 
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izquierda derecha 


cara 


cruz derecha 


Juego de las Monedas 


Juego de la Conducción 


FIGURA 2. Tablas de pagos. Alice escoge una fila y Bob escoge 
una columna. 


arriba o hacia abajo se emplean para subrayar que 
los pagos no tienen por qué medirse en términos 
monetarios. 

La Figura 2 muestra cómo toda la información de 
la Figura 1 puede agruparse en una tabla de pagos, 
con los pagos de Alice en la esquina inferior izquier- 
da de cada celda y los de Bob en la esquina superior 
derecha. También muestra una versión para dos ju- 
gadores del Juego de la Conducción en el que parti- 
cipamos todas las mañanas cuando nos metemos en 
el coche para ir a trabajar. Una vez más, Alice y Bob 
pueden elegir entre dos estrategias puras, izquierda 
y derecha, pero en este caso los pagos de los jugado- 
res se encuentran totalmente alineados en lugar de 
oponerse diametralmente. Cuando los periodistas 
hablan de una situación en la que todos ganan (en 
inglés win-win), tienen en mente algo similar al Jue- 
go de la Conducción. 
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Von Neumann 


El primer resultado de la teoría de juegos fue el teo- 
rema del minimax de John von Neumann, que se 
aplica solamente a juegos como el de las monedas, 
en el cual los jugadores se definen como enemigos 
implacables. Todavía pueden leerse algunos comen- 
tarios desdeñosos sobre la teoría de juegos en los 
cuales Von Neumann es caricaturizado como el ar- 
quetípico guerrero frío, como el que inspiró al doc- 
tor Strangelove en la conocida película. Nos dicen 
que sólo un estratega militar enloquecido pensaría 
en aplicar la teoría de juegos en la vida real, porque 
únicamente un loco o un ciborg cometería el error de 
suponer que el mundo es un juego de puro conflicto. 
Von Neumann era un genio en todos los aspectos. 
Inventar la teoría de juegos fue solamente algo secun- 
dario para él. Es cierto que durante la Guerra Fría fue 
un halcón’, pero, lejos de ser un ciborg loco, era un 
tipo genial al que le gustaba la fiesta y pasarlo bien. 
Como tú y yo, prefería la cooperación al conflicto, 
pero también entendía que el medio para conseguir la 
cooperación no consiste en fingir que la gente no pue- 
de beneficiarse en ocasiones si se causan problemas. 
La cooperación y el conflicto son dos caras de la 
misma moneda, ninguna de las cuales puede expli- 


l. En política, se aplica el término «halcón» para definir a los 
partidarios de programas o medidas más intransigentes o agre- 
sivos. (N. del T.) 
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carse sin tener en cuenta la otra. Reflexionar sobre un 
juego de conflicto puro como el Juego de las Monedas 
no equivale a afirmar que todas las interacciones hu- 
manas sean competitivas. Tampoco se está afirmando 
que toda la interacción humana es cooperativa cuan- 
do se analiza un juego de coordinación pura como el 
Juego de la Conducción. Simplemente se distinguen 
dos aspectos distintos del comportamiento humano 
que pueden estudiarse por separado. 


Preferencias reveladas 


Para tratar a la vez de la cooperación y el conflicto, es 
necesaria una forma de describir la motivación de 
los jugadores, y no limitarse a decir que les gusta ga- 
nar y les desagrada perder. Para tal fin, los economis- 
tas inventaron la idea de utilidad, que permite a cada 
jugador asignar un valor numérico a cada posible 
resultado del juego. 

En los negocios, lo fundamental suelen ser los be- 
neficios, pero los economistas saben que los seres 
humanos a menudo tienen objetivos más complejos 
que simplemente ganar todo el dinero posible. Por 
lo tanto, no podemos identificar la utilidad con el 
dinero. Una respuesta inocente consiste en sustituir 
el dinero por la felicidad. Pero ¿qué es la felicidad?, 
¿cómo se mide? 

Resulta desafortunado que la palabra «utilidad» 
se encuentre vinculada históricamente a los utilita- 
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ristas victorianos como Jeremy Bentham y John 
Stuart Mill, porque los economistas modernos no 
identifican de la utilidad con cuánto placer o cuán 
poco dolor puede sentir una persona. La teoría mo- 
derna rechaza cualquier intento de explicar cómo se 
comportan los individuos en términos de qué pasa 
dentro de sus mentes. Por el contrario, convierte el 
hecho de no establecer supuestos psicológicos en 
una virtud. 

No intentamos explicar por qué Alice o Bob se 
comportan de una determinada manera. En lugar 
de una teoría explicativa, tenemos que contentarnos 
con una teoría descriptiva, que no puede hacer otra 
cosa que decir que Alice o Bob estarían actuando de 
un modo incoherente si en el pasado hicieron eso y 
aquello pero ahora planean hacer esto y lo otro. En 
la teoría de juegos, el objeto consiste en observar las 
decisiones que toman (o tomarían) Alice y Bob 
cuando no están interactuando el uno con el otro o 
con un tercero, así como deducir cómo se compor- 
tarán cuando interactúen en un juego. 

Por lo tanto, no sostenemos que algunas preferen- 
cias son más racionales que otras. Estamos de acuer- 
do con el gran filósofo David Hume, que considera- 
ba la razón «esclava de las pasiones». Como afirmó 
con extravagancia, no habría nada irracional en su 
preferencia por la destrucción del universo entero 
frente a rascarse el dedo. No obstante, nosotros va- 
mos más allá en este camino, ya que consideramos la 
razón como un instrumento para evitar un compor- 
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tamiento incoherente. Por consiguiente, todo com- 
portamiento coherente cuenta como racional. 

Con algunos supuestos ligeros, puede demostrar- 
se que actuar coherentemente es lo mismo que com- 
portarse como si se intentara maximizar el valor de 
algo. Independientemente de lo que este «algo» abs- 
tracto pudiera ser en un contexto determinado, los 
economistas lo llaman «utilidad». No tiene que estar 
correlacionado con el dinero, pero a menudo lo está. 


Asumir riesgos 


Cuando actúa coherentemente, Alice puede no ser 
consciente de que se comporta como si maximizara 
algo a lo que decidimos denominar «su utilidad». 
Pero si queremos predecir su comportamiento, de- 
bemos ser capaces de medir su utilidad en una escala 
de utilidad, similar en gran medida al modo de me- 
dir la temperatura con un termómetro. Igual que las 
unidades de un termómetro se llaman grados, pode- 
mos decir que un útil es una unidad en la escala de 
utilidad de Alice. 

En economía, la ortodoxia solía establecer que las 
escalas cardinales de utilidad carecían de un sentido 
intrínseco, pero afortunadamente Von Neumann no 
lo sabía cuando Oskar Morgenstern apareció un día 
en su casa para quejarse de que en el libro de teoría 
de juegos que escribían juntos no tenían una base 
adecuada para los pagos numéricos. De modo que 
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Von Neumann inventó en ese mismo momento una 
teoría que cuantifica en qué medida Alice desea algo 
en función de los riesgos que está dispuesta a asumir 
para conseguirlo. A partir de ahí podemos descubrir 
qué decisiones tomará en situaciones de riesgo y de- 
terminar la opción que le proporcionará la mayor 
utilidad media. 

Es fácil usar la teoría de Von Neumann para saber 
cuánta utilidad se le puede asignar a algo que Alice 
pueda tener que evaluar. Por ejemplo, ¿cuántos úti- 
les debería asignar Alice para conseguir una cita con 
Bob? 

En primer lugar debemos decidir qué escala de 
utilidad vamos a usar. Para tal fin, hay que seleccio- 
nar dos resultados, que serán el mejor y el peor res- 
pectivamente de cualquier otro resultado que Alice 
tenga probabilidades de encontrar. Estos resultados 
se corresponderán con los puntos de ebullición y de 
congelación del agua usada para calibrar un termó- 
metro Celsius, de modo que la escala de utilidad a 
construir asignará 0 útiles al peor resultado y 100 
útiles al mejor. A continuación hay que considerar 
una gran cantidad de boletos de lotería (gratuitos) 
en los cuales los únicos premios son o bien el mejor 
resultado o el peor. 

Si le ofrecemos a Alice boletos de lotería con pro- 
babilidades cada vez mayores de conseguir el mejor 
resultado en lugar de la cita con Bob, finalmente pa- 
sará de decir no a decir sí. Si la probabilidad de que 
el mejor resultado en el boleto de lotería que la hace 


L AQUETUGAMOS 21 


cambiar de idea es de un 75%, la teoría de Von Neu- 
mann establece que para ella la cita con Bob vale 75 
útiles. Cada punto porcentual adicional que se suma 
a la probabilidad que la hace indiferente correspon- 
de con un útil extra. 

Cuando algunos individuos evalúan sumas de di- 
nero mediante este método, siempre asignan el mis- 
mo número de útiles a cada dólar extra. Denomina- 
mos a estas personas «neutrales al riesgo». Aquellos 
que asignan menos útiles a cada dólar extra que al 
anterior se denominan «aversos al riesgo». 


Seguros 


Alice está sopesando aceptar una oferta de Bob para 
asegurar su mansión de Beverly Hills contra los in- 
cendios. Si rechaza su oferta, se enfrentará a una lo- 
tería en la que acabará con su casa más el coste de la 
prima del seguro si la casa no se incendia y única- 
mente con la prima si se incendia; este resultado 
debe compararse con el valor de la casa menos el 
coste de la prima si ella acepta la oferta de Bob. 

Si es racional para Bob hacer la oferta y para Alice 
aceptarla, él debe pensar que la lotería es mejor que 
el resultado asegurado, mientras que ella debe tener 
la preferencia contraria. Por lo tanto, la existencia de 
empresas de seguros no sólo confirma que puede ser 
racional apostar, en el caso de que los riesgos que se 
asumen sean riesgos calculados, sino también que 
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las personas racionales pueden tener actitudes dis- 
tintas a la hora de tomar riesgos. En el mundo de los 
seguros, los aseguradores están cerca de una postura 
neutral al riesgo y los asegurados son aversos al ries- 
go en diferentes grados. 

Hay que tener en cuenta que los economistas con- 
sideran el grado de aversión al riesgo que muestra 
una persona como una cuestión de preferencias per- 
sonales. Del mismo modo que Alice puede preferir o 
no el helado de chocolate al de vainilla, puede prefe- 
rir o no dedicar 1.000 dólares a asegurar su casa. Al- 
gunos filósofos, entre los que destaca John Rawls, in- 
sisten en que es racional ser averso al riesgo cuando 
se defiende cualquier alternativa distinta a maximi- 
zar la utilidad media que pueda preferirse, pero es- 
tos argumentos no comprenden que las actitudes de 
los jugadores respecto a asumir riesgos ya se han te- 
nido en cuenta al emplear el método de Von Neu- 
mann para asignar utilidades a cada resultado. 

Los economistas cometen un error distinto cuan- 
dio atribuyen la aversión al riesgo al hecho de que 
apostar sea desagradable. La teoría de Von Neu- 
mann sólo tiene sentido cuando los jugadores son 
completamente neutrales hacia el hecho concreto de 
apostar. Como un pastor presbiteriano que asegura 
su casa, no apuestan porque les guste apostar, sino 
que lo hacen simplemente porque a su juicio las pro- 
babilidades están a su favor. 
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La vida no es un juego de suma cero 


Al utilizar un termómetro como los que empleamos 
para medir la temperatura, somos libres de elegir 
el O y la unidad de la escala de utilidad de Alice como 
queramos. Podríamos, por ejemplo, haber asignado 
32 útiles al peor resultado posible y 212 al mejor. El 
número de útiles que vale la cita con Bob en esta es- 
cala se descubre del mismo modo que el que se em- 
plea para convertir los grados Celsius en grados Fa- 
renheit. Así que la cita con Bob que valía 75 útiles en 
la vieja escala valdría 167 útiles en la nueva escala. 

En los juegos básicos analizados hasta ahora, Ali- 
ce y Bob sólo tenían que evaluar los resultados GA- 
NAR y PERDER. Somos libres de asignar a estos suce- 
sos el número de útiles que queramos, siempre que 
les asignemos más útiles a ganar que a perder. Si 
asignamos un punto positivo a ganar y un punto 
negativo a perder, obtenemos las tablas de pagos de 
la Figura 3. 


izquierda derecha 


izquierda 


derecha 


Juego de las Monedas Juego de la Conducción 


FIGURA 3. Pagos numéricos. 
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Los pagos de cada celda del Juego de las Monedas 
de la Figura 3 siempre suman cero, y como se pue- 
den arreglar siempre las cosas para hacer que esto 
ocurra en un juego de conflicto puro, se dice que es- 
tos juegos son de suma cero. Cuando los gurús nos 
dicen que la vida no es un juego de suma cero, no se 
están refiriendo a la suma total de felicidad en el 
mundo; tan sólo nos recuerdan que los juegos en los 
que participamos en la vida real raramente son jue- 
gos de conflicto puro. 


El equilibrio de Nash 


La vieja película Rebelde sin causa sigue emitiéndose 
porque en ella actúa un inolvidable James Dean ha- 
ciendo de atractivo re- 
belde adolescente. El 
Juego del Gallina se in- 
ventó para homenajear 
una escena en la cual él 
y otro chico conducen 
sus coches hacia el bor- 
de de un precipicio y 
demostrar quién se aco- 
barda antes. Bertrand 
Russell es bien conoci- 
do por haber empleado 
el episodio como metá- 
keco L James Dean. fora de la Guerra Fría. 
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despacio deprisa ballet boxeo 


despacio 


deprisa 


Juego del Gallina Guerra de Sexos 


FIGURA 5. Juegos con motivaciones mixtas. 


Prefiero ilustrar el Juego del Gallina con una histo- 
ria más rutinaria en la que Alice y Bob son dos con- 
ductores de mediana edad aproximándose el uno al 
otro por una calle demasiado estrecha como para 
que ambos pasen con seguridad sin que uno de los 
dos aminore la marcha. Por lo tanto, las estrategias de 
la Figura 5 se definen como despacio y deprisa. 

La nueva configuración rebaja el elemento com- 
petitivo de la historia original. El del Gallina se dife- 
rencia de otros juegos de suma cero como el de las 
Monedas en que los jugadores también tienen un 
interés común en evitar un desastre mutuo. 

Los estereotipos que contiene la Guerra de Sexos 
son anteriores al movimiento de liberación de la 
mujer. Alice y Bob son una pareja de recién casados 
de luna de miel en Nueva York. En el desayuno, dis- 
cuten si ir a un combate de boxeo o al ballet por la 
tarde, pero no son capaces de tomar una decisión. 
Más tarde se pierden cada uno por su lado entre la 
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multitud y cada uno tiene que decidir independien- 
temente adónde ir por la tarde. 

La historia que ilustra la Guerra de Sexos pone el 
énfasis en los aspectos cooperativos de su problema, 
pero también existe un elemento de conflicto del 
que carece el Juego de la Conducción, ya que cada 
jugador prefiere que se coordinen en un resultado 
distinto. Alice prefiere el ballet, y Bob, el combate de 
boxeo. 


John Nash 


Todo el mundo ha oído hablar de John Nash desde 
que su vida llegó a las pantallas en la película Una 
mente maravillosa. Como documenta la película, los 
altibajos de su vida no tienen mucho que ver con el 
abanico de experiencias de la mayoría de seres hu- 
manos. Todavía no se había graduado cuando Inició 
la teoría moderna de la negociación racional, Su te- 
sis doctoral formuló el concepto del «equilibrio de 
Nash», que en la actualidad es considerado la pieza 
clave y fundamental de la teoría de juegos. Empren- 
dió la solución de problemas de matemáticas puras 
de primer orden empleando métodos tan originales 
que le valieron una sólida reputación de genio mate- 
mático de máximo nivel. Sin embargo, cayó víctima 
de un tipo de esquizofrenia que destruyó su carrera 
y le dejó languideciendo en la oscuridad durante 
más de cuarenta años, siendo objeto de burlas oca- 
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FIGURA 6. John Nash. 


sionales en el campus de Princeton. Mirando atrás, 
su recuperación a tiempo para recibir el Premio No- 
bel en 1994 parece casi milagrosa. Pero, como co- 
menta el propio Nash, sin su «locura» quizás sólo 
habría sido uno más entre los miles de seres anóni- 
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mos que han vivido y muerto en este planeta sin de- 
jar tras de sí ninguna huella de su existencia. 

No obstante, no hay que ser un genio caprichoso 
para entender la idea del equilibrio de Nash. Hemos 
observado que en un juego los pagos se establecen 
para convertir en tautología el hecho de que los ju- 
gadores racionales busquen maximizar sus pagos 
medios. Eso sería fácil si los jugadores supiesen las 
estrategias que sus oponentes fueran a elegir. Por 
ejemplo, si Alice supiera que Bob va a elegir ballet en 
la Guerra de Sexos, maximizaría sus pagos eligiendo 
también ballet. Es decir, ballet constituye la mejor 
respuesta de Alice a la elección de ballet por parte de 
Bob, un hecho indicado en la Figura 5 con un círcu- 
lo alrededor de los pagos de Alice en la celda resul- 
tante de que ambos jugadores escojan ballet. 

El «equilibrio de Nash» no es otra cosa que una 
pareja de estrategias cuyo resultado es una celda en 
la que ambos resultados están rodeados por un 
círculo. En términos más generales, el equilibrio de 
Nash tiene lugar cuando todos los jugadores eligen a 
la vez la mejor respuesta a las elecciones estratégicas 
de los demás. 

Por lo tanto, en la Guerra de Sexos, tanto (boxeo, 
boxeo) como (ballet, ballet) son equilibrios de Nash. 
De un modo similar, (despacio, deprisa) y (deprisa, 
despacio) son equilibrios de Nash en el Juego del Ga- 
llina. 

¿Por qué habría que preocuparse por los equili- 
brios de Nash? Hay dos razones principales para 
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ello. La primera supone que idealmente los jugado- 
res racionales razonan para llegar a una solución del 
Juego. La segunda supone que la gente llega a la so- 
lución del juego mediante un proceso evolutivo de 
ensayo y error. Gran parte de la capacidad predictiva 
de la teoría de juegos radica en la posibilidad de dis- 
currir entre estas explicaciones alternativas. Pocas 
veces sabemos mucho sobre los detalles de los pro- 
cesos evolutivos, pero en ocasiones podemos dar un 
salto adelante para predecir dónde acabarán pre- 
guntándonos qué harían unos jugadores racionales 
en la situación analizada. 


Interpretación racional 


Supongamos que alguien todavía más listo que Nash 
o Von Neumann hubiera escrito un libro que pre- 
sentara una relación de todos los juegos posibles 
Junto a una recomendación autorizada sobre cómo 
deberían comportarse en el juego los jugadores ra- 
cionales. Un libro de teoría de juegos tan maravillo- 
so necesariamente seleccionaría un equilibrio de 
Nash como solución para todos los juegos. Además, 
sería racional para al menos un jugador desoír los 
consejos del libro, que por consiguiente dejaría de 
tener autoridad. 

Supóngase, por ejemplo, que el libro recomenda- 
ra que los dos adolescentes que juegan al Gallina eli- 
gieran despacio, como sus madres desearían. Si el li- 
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bro tuviera ese carácter de autoridad, cada jugador 
sabría entonces que el otro jugará despacio. Pero un 
jugador racional del Gallina que sabe que su opo- 
nente va a elegir despacio, necesariamente elegirá de- 
prisa; con lo que refutaría el presunto carácter de au- 
toridad del libro. 

Nótese que el razonamiento en esta defensa de los 
equilibrios de Nash es circular. ¿Por qué juega Alice 
de esta manera? Porque Bob juega de ese modo. ¿Por 
qué juega Bob de ese modo? Porque Alice juega de 
esta manera. 

Se puede recurrir a varias expresiones latinas para 
aquellos que no estén satisfechos con argumentos 
circulares como éstos. La primera vez que se me acu- 
só de cometer la falacia del circulus in probando al 
hablar de equilibrios tuve que buscar su significado. 
Resulta que tuve suerte de no ser acusado de la aún 
más deshonrosa petitio principii. Pero obviamente 
todos los argumentos deben ser circulares o reducir- 

se a una regresión infinita si uno nunca deja de pre- 
guntar por qué. Las definiciones de los diccionarios 
son el ejemplo más conocido. 

En los juegos, o bien podemos contemplar por 
siempre la infinita regresión que empieza con: «Ali- 
ce piensa que Bob piensa que Alice piensa que Bob 
piensa...», o refuglarnos en la circularidad integrada 
en la idea de un equilibrio de Nash. Ello interrumpe 
la regresión infinita al observar que cualquier otro 
perfil estratégico acabará por desestabilizarse cuan- 
do los jugadores empiecen a pensar sobre lo que es- 
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tán pensando los demás jugadores. O, dicho de otra 
forma, para que las creencias de los jugadores sobre 


los planes de los demás sean coherentes, deben estar 
en equilibrio. 


Interpretación evolutiva 


La interpretación racional del equilibrio de Nash 
tuvo tanto éxito entre los pioneros de la teoría de 
Juegos que la interpretación evolutiva casi se olvidó 
por completo. ¡Incluso los editores de la revista que 
publicó el artículo de Nash sobre los equilibrios re- 
chazaron sus comentarios sobre el tema por carecer 
de interés! Pero la teoría de juegos jamás sería ca- 
paz de predecir el comportamiento de la gente co- 
rriente si la interpretación evolutiva no tuviera vali- 
dez. Por ejemplo, el famoso matemático Émile Borel 
reflexionó sobre la teoría de juegos antes que Von 
Neumann, y llegó a la conclusión de que el teorema 
minimax probablemente fuera falso. De modo que 
s1 ni siquiera alguien tan inteligente como Borel no 
era capaz de encontrar una solución para juegos 
de la clase más simple, ¿qué esperanza nos podría 
quedar? 

Existen muchas posibles interpretaciones evoluti- 
vas de los equilibrios de Nash que difieren en los 
procesos de ajuste mediante los cuales los jugadores 
pueden encontrar la forma de alcanzar un equili- 
brio. En los procesos de ajuste simples, los pagos del 
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juego se identifican con el nivel de aptitud de los ju- 
gadores. Los procesos que favorecen estrategias más 
aptas en perjuicio de sus hermanos menos exitosos 
sólo pueden dejar de funcionar cuando consegui- 
mos un equilibrio de Nash, porque únicamente en- 
tonces todas las estrategias supervivientes serán tan 
aptas como sea posible en esas circunstancias. Por 
consiguiente, no es necesario que nuestros jugado- 
res sean fenómenos de la matemática para que los 
equilibrios de Nash sean relevantes. A menudo pre- 
dicen bastante bien el comportamiento de animales. 
Tampoco es que la relevancia evolutiva de los equi- 
librios de Nash esté confinada a la biología. Tienen 
un papel predictivo siempre que un proceso de ajus- 
te tienda a eliminar las estrategias que generan pa- 
gos bajos. 

Pongamos un ejemplo: los agentes de bolsa que 
consiguen menos beneficios que sus competidores 
se van a la quiebra. Las reglas generales empleadas 
por los agentes bursátiles se encuentran por lo tanto 
sujetas al mismo tipo de presiones evolutivas que las 
que tienen los genes de los peces o de los insectos. 
Por consiguiente, sí tiene sentido examinar los equi- 
librios de Nash en juegos protagonizados por agen- 
tes de bolsa, aunque todos sabemos que algunos de 
ellos no serían capaces de orientarse en una pecera 
de peces dorados, por no decir en un libro de teoría 
de juegos. 
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El Dilema del Prisionero 


El juego básico más famoso de todos es el Dilema del 
Prisionero. En la historia tradicional que se emplea 
para motivar el juego, Alice y Bob son dos gángsters 
en el Chicago de los años veinte. El fiscal del distrito 
sabe que son culpables de un crimen importante, 
pero es incapaz de encarcelarlos a menos que uno de 
ellos confiese. Ordena su detención y les ofrece por 
separado el acuerdo siguiente: 


Si confiesas y tu cómplice no confiesa, sales en libertad. 

Si tú no confiesas pero tu cómplice confiesa, te senten- 
ciarán a ir a la cárcel con la condena más larga. 

Si los dos confesáis, ambos seréis encarcelados, pero no 
se aplicará la condena más larga. 

Si ninguno de los dos confiesa, ambos seréis incrimi- 
nados con cargos de evasión fiscal con los que la pena de 
prisión está asegurada. 


La historia se hace más interesante si Alice y Bob han 
acordado mantener la boca cerrada en caso de que 
en algún momento los pongan en esa tesitura. Por lo 
tanto, aguantar se corresponde con la cooperación y 
confesar con la defección, como en la tabla de la iz- 
quierda de la Figura 7. Los pagos de la tabla se co- 
rresponden con años de cárcel orientativos (bajo el 
supuesto de que un útil siempre equivalga a un año 
extra de libertad). 

Una historia menos barroca asume que tanto Ali- 
ce como Bob tienen acceso a un bote con dinero. 
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defección cooperar 
paloma halcón 


defección 
paloma 


halcón 


versión del gángster versión de dar y recibir 


FIGURA 7. Dos versiones del Dilema del Prisionero; en la 
versión de la derecha, paloma representa dar y halcón re- 
cibir. 


Ambos gozan de independencia para dar a su opo- 
nente 2 dólares del bote o meterse 1 dólar del bote 
en su propio bolsillo. El supuesto de que a Alice y 
Bob solamente les importara el dinero nos lleva a la 
tabla de pagos de la derecha de la Figura 7, donde los 
útiles se han identificado con dólares. En este caso, la 
estrategia altruista de dar 2 dólares se ha denomina- 
do paloma, y la de tomar 1 dólar ha adoptado la eti- 
queta halcón. 

Los círculos alrededor de las mejores elecciones 
revelan que el único equilibrio de Nash de la ver- 
sión de «dar o tomar» del Dilema del Prisionero 
consiste en que tanto Alice como Bob se decidan 
por la estrategia halcón, aunque cada uno obten- 
dría más si ambos se inclinaran por paloma. La ver- 
sión con gángsters es estratégicamente idéntica. En 
el único equilibrio de Nash, los dos optan por la de- 
fección, con el resultado de que ambos pasan una 
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larga temporada en la cárcel, aunque cada uno reci- 
biría una sentencia mucho más benévola si ambos 
cooperaran. 


¿La paradoja de la racionalidad? 


Una generación entera de académicos se tragó el an- 
zuelo de que el Dilema del Prisionero representa la 
esencia del problema de la cooperación entre huma- 
nos. Por consiguiente, se asignaron la tarea irrealiza- 
ble de explicar las razones por las cuales la resolu- 
ción en la teoría de juegos de la supuesta «paradoja 
de la racionalidad» es errónea (véase «Falacias del 
Dilema del Prisionero», Capítulo 10). Pero los ex- 
pertos en teoría de juegos consideran que es total- 
mente falso que el Dilema del Prisionero capte lo 
fundamental de la cooperación humana. Por el con- 
trario, representa una situación en la que los dados 
están tan cargados contra el surgimiento de la coo- 
peración como fuera posible. 

Si resultara adecuado modelizar el gran juego de 
la vida al que juega la especie humana a través del 
Dilema del Prisionero, ¡no habríamos evolucionado 
como animales sociales! Por lo tanto, ya no vemos 
más necesidad en solucionar la paradoja inventada 
de la racionalidad que en explicar por qué la gente se 
ahogaba cuando la echaban al lago Michigan con los 
pies metidos en un bloque de cemento. La paradoja 
de la racionalidad no existe. Los jugadores raciona- 
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les no cooperan en el Dilema del Prisionero porque 


las condiciones necesarias para una cooperación ra 
cional están ausentes. 

Afortunadamente, la fase de la paradoja de la ra 
cionalídad en la historia de la teoría de juegos ya esta 
casi acabada. En la medida en que son recordadas, 
las nurnerosas falacias que se inventaron en un in- 
tento desesperado por mostrar que es racional coo- 
perar en un Dilema del Prisionero se citan mayori- 
tariamente como ejemplos divertidos de lo que los 
psicólogos llaman «razonamiento mágico», en el 
cual la lógica se manipula para asegurarse el resulta- 
do esperado. Mi ejemplo favorito es la afirmación de 
Immanuel Kant de que la racionalidad exige obede- 
cer a su Imperativo categórico. En el Dilema del Pri- 
sionero, los jugadores racionales siempre elegirían 
paloma, porque sería la mejor estrategia si todo el 
mundo la eligiera. 


Dominación 


la ¡dea de que necesariamente es irracional hacer co- 
sas que serían malas si todo el mundo las hiciera goza 
de mucho predicamento. Probablemente tu madre 
estaba tan orgullosa de este argumento como la mía. 
Por lo tanto, vale la pena reiterar la siguiente refuta- 
cion radical en el caso del Dilema del Prisionero. 
lua no dar nada por sentado, empezaremos por 
piovuntar de dónde vienen los pagos que represen- 
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tan las preferencias de los jugadores en el Dilema del 
Prisionero. La teoría de las preferencias reveladas 
nos indica que encontraremos la respuesta median- 
te la observación de las decisiones que toman (o to- 
marían) Alice y Bob cuando solucionan problemas 
de decisión individuales. 

Por lo tanto, asignarle un pago mayor a Alice en la 
esquina inferior izquierda de la tabla de pagos del 
Dilema del Prisionero que en la celda superior iz- 
quierda significa que Alice elegiría halcón en el pro- 
blema de decisión individual al que se enfrentaría si 
supiera de antemano que Bob ha elegido paloma. 
Análogamente, asignar un pago mayor en la celda 
inferior derecha representa que Alice elegiría halcón 
cuando se enfrentara a un problema de decisión in- 
dividual en el que supiera de antemano que Bob ha 
elegido halcón. 

Por consiguiente, la propia definición del juego 
establece que halcón es la mejor respuesta de Ali- 
ce cuando la elección de Bob es paloma y también 
cuando sabe que Bob elige halcón, de modo que no 
necesita saber nada sobre lo que Bob ha elegido en 
realidad para saber cuál es la mejor respuesta. Para 
ella resulta racional adoptar la estrategia halcón sea 
cual sea la estrategia que él piensa elegir. En estas 
inusuales circunstancias, decimos que la estrategia 
halcón es dominante respecto a las estrategias alter- 
nativas de Alice. 
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¿Objeciones? 


Es común que se hagan dos objeciones al análisis 
precedente. La primera niega que Alice fuera a elegir 
la defección en la versión gangsteriana del Dilema 
del Prisionero si supiera que Bob ha elegido coope- 
rar. Se proponen varias razones para ello, que de- 
penden de lo que se crea sobre las condiciones en el 
Chicago de Al Capone, pero dichas objeciones no 
dan en el clavo. Si Alice no le traicionara si supiera 
que Bob ha decidido cooperar, no estaría jugando al 
Dilema del Prisionero. Aquí o en cualquier otra par- 
te, es importante no tomarse demasiado en serio las 
historias que motivan los juegos. Lo que define el 
Dilema del Prisionero es la tabla de pagos de la Figu- 
ra 7, no las historias banales que lo acompañan. 

La segunda objeción siempre me intriga. Se dice 
que apelar a la teoría de las preferencias reveladas re- 
duce a una tautología la afirmación de que en el Di- 
lema del Prisionero la defección es racional. Dado 
que las tautologías carecen de contenido sustantivo, 
¡puede ignorarse la afirmación! Pero ¿alguien diría 
lo mismo de 2 + 2 = 4? 


Experimentos 


Una respuesta alternativa consiste en argumentar 
que no importa qué es racional en el Dilema del Pri- 
sionero, ya que los experimentos de laboratorio 
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muestran que en la realidad los individuos eligen 
paloma. Los pagos de dichos experimentos no sue- 
len determinarse mediante el empleo de la teoría de 
las preferencias reveladas. Casi siempre consisten 
sólo en dinero, pero, no obstante, los resultados pue- 
den ser muy instructivos. 

Los sujetos no experimentados cooperan algo 
más de la mitad del tiempo de PROMEDIO, pero es 
abrumadora la evidencia de que en juegos como el 
Dilema del Prisionero la tasa de defecciones aumen- 
ta progresivamente a medida que los sujetos adquie- 
ren experiencia, hasta el punto que sólo cerca de un 
10% de los sujetos sigue cooperando después de diez 
rondas aproximadamente. 

También se mencionan las simulaciones por or- 
denador, que supuestamente muestran que la evolu- 
ción al final generará cooperación en el Dilema del 
Prisionero, pero estos detractores a menudo han 
confundido el Dilema del Prisionero con su primo 
repetido indefinidamente, en el cual la cooperación 
es realmente un equilibrio de Nash (véase «Toma y 
daca», Capítulo 5). 


2. La suerte 


El análisis de Conan Doyle de su versión del Juego 
de las Monedas en El problema final le hace un flaco 
favor a la supuesia maestría intelectual de su héroe. 
Edgar Allan Poe lo hace mejor en La carta robada, en 
la que el villano ha robado una carta y el problema 
es dónde buscarla. 

Poe sostiene que la forma de ganar consiste en ex- 
tender cadenas de razonamiento del tipo «él piensa 
que yo pienso que él piensa que yo pienso...» un 
paso más allá que tu oponente. En defensa de la pro- 
posición, inventa un chico que gana continuamente 
en el Juego de las Monedas al imitar la expresión fa- 
cial de su oponente y, supuestamente, aprender de 
este modo qué debe de estar pensando. Hay que ad- 
mitir que es impresionante el número de Jugadores 
de Póquer que pierden sus manos por su incapaci- 
dad para controlar su lenguaje corporal, pero tanto 
Alice como Bob pueden emplear el truco de Poe con 
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éxito, aunque ninguno de los dos aprenda a poner 
cara de póquer. 

La teoría de juegos va más allá de la aparentemen- 
te infinita regresión a la que Alice y Bob se enfrentan 
al apelar a la idea del equilibrio de Nash. Pero segui- 
mos con un problema, porque el truco de rodear con 
un círculo las mejores respuestas no funciona con el 
Juego de las Monedas. Después de rodear con círcu- 
los todos los pagos de la Figura 3 que son la mejor 
respuesta posible, acabamos con dos equilibrios de 
Nash en el Juego de la Conducción, pero ninguno en 
el Juego de las Monedas. 

Este hecho puede parecer misterioso a aquellos 
que recuerdan que John Nash consiguió su Pre- 
mio Nobel en parte por demostrar que todos los 
Juegos finitos tienen al menos un equilibrio. La 
respuesta a este misterio es que tenemos que mi- 
rar más allá de las estrategias puras que hemos 
analizado hasta ahora y considerar también estra- 
tegias mixtas. 


¿Tiene sentido hacer aleatorias las decisiones? 


Una estrategia mixta requiere que los jugadores ha- 
gan aleatoria su elección de una estrategia pura. Es 
natural objetar que sólo los locos toman decisiones 
importantes de manera aleatoria, pero las estrategias 
mixtas se usan constantemente sin que nadie se dé 
cuenta. 
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Mi ejemplo favorito surgió cuando estaba aseso- 
rando a una empresa turística sobre un asunto legal. 
La teoría de juegos predice que una empresa como 
ésta empleará una estrategia mixta en el juego de fi- 
Jar los precios cuando la demanda de vacaciones se 
muestra inesperadamente baja. No obstante, cuan- 
do le pregunté a un alto ejecutivo si su empresa esta- 
bleció sus precios de forma aleatoria el año anterior, 
reaccionó con horror a una insinuación tan fuera de 
lugar. En ese caso, ¿por qué eran sus precios para si- 
milares vacaciones tan distintos? Su respuesta fue 
instructiva: «Tienes que mantener a la competencia 
en suspense intentando adivinarlos». 

Su respuesta demuestra que entendía perfecta- 
mente por qué la teoría de juegos a veces recomienda 
el uso de estrategias mixtas. Lo que no quería reco- 
nocer es que el método de su empresa para establecer 
los precios consistía esencialmente en un mecanismo 
de decisiones aleatorias. Nadie cortó la baraja. Nadie 
agitó los dados en el cubilete. Pero desde el punto de 
vista de un rival que intentara predecir lo que su em- 
presa cobraría por dos semanas en las Bahamas, bien 
podrían haberlo decidido de ese modo. 


Equilibrios de Nash mixtos 


El uso de estrategias mixtas en el Juego de las Mone- 
das, en el que mantener al oponente tratando de adi- 
vinar lo es todo, no es sorprendente en absoluto. 
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FIGURA 8. Tirada de dados. 


Como todos los niños saben, la solución consiste en 
hacerlo aleatorio entre cara y cruz. Siambos jugado- 
res emplean esta estrategia mixta, el resultado es un 
equilibrio de Nash. Cada jugador gana la mitad de 
las veces, que es lo mejor que ambos pueden conse- 
guir dada la elección estratégica del otro. 

De un modo similar, hay un equilibrio de Nash en 
el Juego de la Conducción si ambos jugadores eligen 
izquierda y derecha con la misma probabilidad, por 
lo que tiene tres equilibrios de Nash, dos puros y 
uno mixto. Puede decirse lo mismo tanto en el Juego 
del Gallina como en la Guerra de Sexos, pero el equi- 
librio de Nash mixto de la Guerra de Sexos requiere 
algo más que limitarse a considerar igual de proba- 
bles las dos estrategias puras. 

En la Guerra de Sexos, a Bob le gusta el boxeo el 
doble que el ballet, de modo que Alice tiene que de- 
cidirse por la estrategia de boxeo la mitad de veces 
que por el ballet para asegurarse la misma media de 
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pagos que con sus dos estrategias puras. Dado que 
en ese caso a Bob no le importa cuál de sus dos estra- 
tegias puras jugar, las dos son igual de buenas, in- 
cluida la estrategia mixta que le da la misma proba- 
bilidad al ballet que al boxeo. Pero el uso de esta 
estrategia mixta hace a Alice indiferente ante sus 
dos estrategias puras. Así que todas las estrategias de 
ella son igual de buenas, incluida la estrategia mixta 
que hace que el boxeo sea el doble de probable que el 
ballet. Este cierre del círculo muestra que hemos en- 
contrado un equilibrio de Nash mixto en el cual tan- 
to Alice como Bob se deciden por su estrategia favo- 
rita dos tercios del tiempo. 


Hacer indiferente al otro 


Los jugadores racionales nunca hacen aleatoria la 
elección entre dos estrategias puras a menos que 
sean indiferentes ante ellas. Si una estrategia fuera 
mejor, la estrategia inferior nunca se jugaría. ¿Qué 
puede hacerte indiferente ante dos estrategias? En 
la Guerra de Sexos, la razón se encuentra en la creen- 
cia de que tu oponente va a emprender una estrate- 
gia mixta que iguala los pagos medios que se derivan 
de cada una de tus estrategias. Esta característica del 
equilibrio de Nash mixto lleva en ocasiones a resul- 
tados que parecen paradójicos a primera vista. 

En el Juego del Buen Samaritano participa toda 
una población de jugadores idénticos, todos los cua- 
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les quieren que alguien responda a su llamada de au- 
xilio. Cada jugador consigue diez útiles si alguien 
responde y nada si nadie responde. La pega es que 
ayudar es una molestia, de modo que todos los juga- 
dores que ofrecen su ayuda deben sustraer un útil de 
sus pagos. 

Si nadie más piensa ayudar, lo mejor que puede 
hacerse es quedarse la ayuda para uno mismo. Si to- 
dos los demás piensan ayudar, se maximizan los pa- 
gos si no se hace nada. Por lo tanto, el único equili- 
brio de Nash posible en el que todos usan la misma 
estrategia de un modo independiente es necesaria- 
mente mixto. En un equilibrio de Nash mixto como 
éste, es necesario que haya precisamente una posibi- 
lidad entre diez de que nadie más ofrezca su ayuda, 
porque ésa es la frecuencia que te hace indiferente 
entre ayudar y no ayudar. 

La probabilidad real de que se ofrezca ayuda en 
equilibrio es algo más alta, porque hay una cierta 
probabilidad de que te ofrezcas para ayudarte a ti 
mismo. No obstante, la probabilidad de que cual- 
quier jugador ofrezca ayuda en equilibrio debe ser 
menor a medida que la población crece, porque la 
probabilidad de que nadie más ayude debe ser igual 
a 1/10. De modo que, a mayor población, menor es 
la probabilidad de que alguien ayude. Con sólo dos 
jugadores, cada uno ayuda con una probabilidad de 
9/10 y la petición de ayuda únicamente se pasa por 
alto una vez de cada cien. Con un millón de jugado- 
res, cada uno tiene una probabilidad de ayudar tan 
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pequena que cerca de una vez de cada diez nadie en 
absoluto responde a la petición de ayuda. 

Las consecuencias pueden ser aterradoras, como 
ilustra un conocido caso en Nueva York. Una noche, 
una mujer fue atacada de manera prolongada, y al 
final acabó asesinada en la calle. Mucha gente la oyó 
pedir auxilio a gritos, pero nadie llegó a llamar a la 
policía. ¿Deberíamos estar de acuerdo con lo que di- 
cen los periódicos y deducir que la vida en la ciudad 
nos convierte a todos en monstruos? Quizás es ver- 
dad, pero el Juego del Buen Samaritano indica que 
incluso la gente de ciudades pequeñas podría com- 
portarse de la misma forma si se encontrara en la 
misma situación. 

El voto tiene un carácter similar. Por tomar un 
caso extremo, supongamos que Alice y Bob son los 
únicos candidatos a la presidencia. Es bien sabido 
que Bob es un caso perdido; sólo su madre cree que 
sería el mejor presidente. Ella tiene claro que votará, 
pero ¿por qué deberían preocuparse los demás? 
Como en el Juego del Buen Samaritano, añadir más 
votantes sólo empeora las cosas. En una situación de 
equilibrio, Bob saldrá elegido con una probabilidad 
irreductible aunque haya un millón de votantes. 

Los juegos de voto de este tipo no son más que 
modelos de referencia. En la realidad, la gente ape- 
nas piensa en términos racionales sobre si votar o 
no. Aunque lo hicieran, podrían llegar a la conclu- 
sión de que acudir al colegio electoral es un placer en 
lugar de una tortura. Sin embargo, el modelo mues- 
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tra que los expertos que acusan de irracional a la 
gran minoría de personas que no votan en las elec- 
ciones presidenciales están diciendo una tontería. 
Si queremos hacer que la gente vote, debemos ten- 
der hacia un sistema más descentralizado en el que 
cada voto cuente realmente lo suficiente como para 
compensar la falta de entusiasmo hacia el voto que 
mucha gente obviamente tiene. Si no podemos per- 
suadir a cada persona de que le guste votar y no po- 
demos cambiar nuestro sistema político, simple- 
mente tendremos que acostumbrarnos a que se 
queden en casa en la jornada electoral. La simple 
repetición de la consigna «cada voto cuenta» nun- 
ca funcionará, porque no es cierta. 


Alcanzar un equilibrio 


¿Cómo encuentra la gente el camino hasta el equili- 
brio de Nash? Esta pregunta resulta especialmente 
apremiante en el caso de los equilibrios mixtos. ¿Por 
qué debería Alice adaptar su estrategia para hacer 
que Bob se muestre indiferente ante algunas de sus 
estrategias? 

Los estudios sobre deporte demuestran que los 
atletas a veces se comportan de un modo muy simi- 
lar a las predicciones de la teoría de juegos. Un ejem- 
plo se encuentra en los penaltis del fútbol. ¿Hacia 
dónde habría que dirigir el balón? ¿Cómo tendría 
que saltar el portero? El tenis es otro ejemplo. ¿Ten- 
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dria que hacer un smash o un globo? Parece impro- 
Dable que los entrenadores lean libros de teoría de 
Juegos, así que, ¿cómo pueden saber la frecuencia 
idónea con la que elegir cada opción? Presumible- 
mente, lo aprenden por ensayo y error. 

Nadie entiende todas las distintas maneras por las 
que la gente real aprende nuevas formas de hacer 
las cosas, pero tenemos algunos modelos básicos 
que captan parte de lo que tiene que estar pasando. 
Incluso el inocente modelo siguiente funciona sor- 
prendentemente bien. 

Alice y Bob son robots que juegan al mismo Juego 
repetidamente. En cada repetición, Alice es progra- 
mada para dar su mejor respuesta a una estrategia 
mixta en la que cada una de las estrategias puras de 
Bob es elegida con la misma frecuencia con la que éste 
las ha empleado en el pasado. Bob tiene el mismo pro- 
grama, de modo que ni él ni Alice son completamente 
racionales, porque en ocasiones ambos podrían mejo- 
rar sus pagos si fueran programados con mayor inteli- 
gencia. Los expertos en teoría de juegos dicen que so- 
lamente tienen una racionalidad limitada. 

Con el paso del tiempo, las frecuencias con las que 
los robots han jugado su segunda estrategia evolu- 
cionan como muestra la Figura 9 ( que se ha simpli- 
ficado pasando de un tiempo discreto a continuo). 
Por ejemplo, la mejor respuesta de Alice en el Juego 
de las Monedas es cruz cuando la frecuencia actual 
con la que Bob ha elegido cruz pasa de la mitad. De 
este modo, la frecuencia de cruz de Alice crecerá has- 
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4 Bob 


todo siempre 
ou deprisa 


cruz en 
Lomad 


de casos 


ruz . nunca 
Alice o 
DUNCA deprisa - 
cruz cruz en la todo nunca siempre 
nunca mitad de cruz deprisa deprisa 
casos 


Juego de las Monedas Juego del Gallina 


FIGURA 9, Aprender a jugar en equilibrio. 


ta que la frecuencia de cruz de Bob caiga por debajo 
de la mitad, momento a partir del cual empezará a 
bajar bruscamente. 

Seguir las flechas de la Figura 9 siempre lleva a un 
equilibrio de Nash. No importa cómo inicialicemos 
a los robots: alguien que cuente con qué frecuencia 
eligen sus estrategias puras al final difícilmente po- 
drá distinguir uno de nuestros robots de racionali- 
dad limitada de un jugador perfectamente racional. 

En el caso del Juego de las Monedas, que está más 
cerca del tenis o el fútbol, las frecuencias con las que 
se elige cara o cruz siempre convergen en sus valores 
de equilibrio de 1/2. En los experimentos de labora- 
torio con sujetos humanos, el patrón general es en 
gran medida el mismo, aunque las frecuencias no 
evolucionan de un modo tan regular y empiezan a 
oscilar cuando se acercan lo suficiente al equilibrio 
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mixto, ya que los jugadores son casi indiferentes en 
tre las estrategias disponibles. 

La situación en el Juego del Gallina es más com- 
plicada, Cada equilibrio puro tiene una cuenca de 
atracción. Si inicializamos nuestros robots para que 
empiecen en la cuenca de atracción de un equilibrio 
determinado, acabarán convergiendo en ese equili- 
brio. La cuenca de equilibrio de (despacio, deprisa) 
se encuentra por encima de la diagonal en la Figu- 
ra 9. La cuenca de equilibrio de (deprisa, despacio) se 
encuentra por debajo de la diagonal. La cuenca de 
equilibrio del equilibrio mixto no es otra que ] 
pia diagonal. iaa 

Es fácil diseñar Juegos en los que el comporta- 
miento de robots como Alice y Bob diera vueltas in- 
finitamente sin establecerse nunca un equilibrio 
pero los seres humanos son capaces de aprender de 
maneras más sofisticadas que Alice y Bob. En con- 
creto, cuando aprendemos cómo comportarnos al 
enfrentarnos con un nuevo Juego, por lo general ya 
poseemos un alto nivel de comentarios y sugeren- 
cias sobre cuál ha de ser nuestro comportamiento 

Por ejemplo, los agentes de bolsa novatos apren: 

den el oficio de sus colegas más experimentados 

Los científicos Jóvenes analizan detenidamente la 

historia de los laureados con el Nobel con la espe- 

ranza de hallar el secreto de su éxito. Los a 

reciclan tediosamente las tramas de los últimos best 

sellers. Los compradores se cuentan los unos a los 
otros dónde encontrar las mejores ofertas. Los mo- 
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delos basicos para dicho aprendizaje social o de 
imitación convergen de un modo más rápido y fia- 
ble en equilibrios de Nash que los modelos en los 
que los individuos aprenden en solitario por ensa- 
yo y error. 

La teoría evolutiva de los juegos consiste en el es- 
tudio de dichos modelos dinámicos. Su aplicación a 
la biología evolutiva es tan importante que le dedi- 
camos todo un capítulo (Capítulo 8). 


Teorema minimax 


Cuando un bisoño John Nash llamó a la oficina 
de Von Neumann para contarle su demostración de 
que todos los juegos finitos tienen al menos un equi- 
librio de Nash si se permiten estrategias mixtas, Von 
Neumann se mostró desdeñoso. ¿Por qué no recibió 
la contribución de Nash con los brazos abiertos? 

Es cierto que el método que Nash empleó para 
probar su teoría no era nuevo para Von Neumann, 
que había sido pionero del mismo método. También 
es cierto que el enfoque de Nash probablemente 
adolecía de falta de tacto, dado que se estaba hacien- 
do famoso por llamar a Albert Einstein, más o me- 
nos, para explicarle cómo hacer física. Pero Von 
Neumann no tenía nada que temer de un descarado 
joven estudiante de doctorado que se ejercitaba en 
su dominio. Creo que existía una razón más impor- 
tante para la falta de interés de Von Neumann. 
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Da la impresión de que Von Neumann nunca re- 
flexionó mucho sobre la interpretación evolutiva de 
la teoría de juegos. Creía que el propósito de estudiar 
un juego debería consistir en identificar una solu- 
ción racional clara y definida. La idea del equilibrio 
de Nash no cumple los requisitos, pues la mayoría de 
Juegos tienen muchos equilibrios de Nash y a menu- 
do no hay una razón puramente racional para selec- 
cionar un equilibrio en lugar de otro. Como Von 
Neumann destacó posteriormente, el criterio de la 
mejor respuesta posible sólo nos dice que algunos 
perfiles estratégicos no pueden ser la solución racio- 
nal de un juego, pero queremos saber qué perfiles 
estratégicos pueden considerarse soluciones. 


Minimax y maximin 


Presumiblemente, Von Neumann limitó su aten- 
ción a juegos de suma cero con dos jugadores por- 
que son una de las pocas clases de Juegos en los que 
puede realizarse su ideal de una única solución. Re- 
sulta desafortunado que su demostración de este 
hecho tuviera que llamarse teorema minimax, por- 
que la solución racional de un juego de suma cero 
de dos jugadores realmente consiste en que cada ju- 
gador aplique el principio del maximin. Éste esta- 
blece que hay que calcular el peor pago que podrías 
Obtener de cada una de tus estrategias mixtas para 
entonces elegir aquella estrategia que maximizaría 
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tus pagos si el escenario siempre fuera el del peor 
caso posible. 

Por ejemplo, lo peor que le podría pasar a Alice en 
el Juego de las Monedas es que Bob adivinara la estra- 
tegia mixta que ella fuera a aplicar. Si esta estrategia 
mixta consiste en que Alice elige cara más de la mitad 
de las veces, Bob elegirá cruz todo el rato. En ese caso, 
clla perderá la mayoría de las veces y sus pagos serán 
negativos. Si la estrategia mixta de Alice consiste en 
elegir cruz más de la mitad de las veces, Bob jugará 
cara todo el rato. Una vez más, ella perderá más de la 
mitad de las veces y sus pagos volverán a ser negati- 
vos. Por lo tanto, la estrategia maximin de Alice con- 
siste en jugar cara y cruz con la misma frecuencia, lo 
que le garantiza unos pagos de exactamente cero. 

Sólo un paranoico encontraría atractivo en gene- 
ral el principio maximin, ya que asume que el uni- 
verso te ha elegido para convertirte en su enemigo 
personal. No obstante, si Alice juega con Bob en un 
juego de suma cero, éste es el universo relevante y, 
por lo tanto, en este caso concreto, el universo es 
realmente el enemigo personal de Alice. 


¿Por qué maximin? 


Irónicamente, el teorema de Von Neumann deriva 
inmediatamente de la demostración hecha por Nash 
de que todos los juegos finitos tienen al menos un 
equilibrio de Nash. 
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Para verlo, hay que empezar por localizar el equ: 
librio de Nash en un Juego de suma cero de dos ju 


gadores. Llamaremos fila a la estrategia de equilibric 
de Alice y columna a la estrategia de equilibrio de 
Bob. Los pagos en equilibrio se llamarán valor de 


Alice y valor de Bob. Por ejemplo, en el Juego de las 
Monedas tanto fila como columna son estrategias 
mixtas en las cuales cara y cruz se juegan con la mis- 
ma probabilidad. El valor de Alice y el valor de Bob 
son el pago de cero que cada jugador obtiene de me- 
dia si juegan de este modo. 

Alice no puede estar segura de conseguir más 
que el valor de Alice porque Bob siempre podría ele- 
gir columna, la mejor respuesta ante la cual es fila. 
Por otra parte, Alice puede estar segura de conse- 
guir como mínimo el valor de Alice si juega fila, ya 
que lo mejor que Bob puede responder es columna, 
y lo mejor que Bob puede hacer por sí mismo coin- 
cide con lo peor que puede hacerle a Alice. De 
modo que el valor de Alice es el pago maximin de 
Alice, y fila conforma una de sus estrategias maxi- 
min. 

Por el mismo razonamiento, el valor de Bob con- 
siste en su pago maximin y columna es una de las es- 
trategias maximin, dado que el valor de Alice y el va- 
lor de Bob suman cero, lo mismo que sus pagos 
maximin. Por consiguiente, ninguno de los jugado- 
res puede conseguir más que su pago maximin a 
menos que el otro consiga menos. De modo que con 
el principio maximin no se puede conseguir un re- 
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sultado mejor en un juego de suma cero de dos juga- 
dores contra un oponente racional. e 

La demostración de este hecho por parte de Von 
Neumann se denomina «teoría del minimax», ai 
que afirmar que los pagos maximin de Alice y A 
suman cero equivale a decir que el pago a > 
Alice equivale a su pago máximo. Pero no o - 
meterse el error común de pensar que, por lo tan x 
Von Neumann recomendaba usar el principio e 
max. ¡Nadie querría calcular el ed pago E 
que podría obtenerse de cada una de as i ra 
mixtas disponibles para, a continuación, € a Sa 
quier estrategia que mintmizara los pagos si ele 
nario siempre fuera el mejor posible! 


Descubrir estrategias maximin 


Desde un punto de vista retrospectivo, es peta 
ma que los matemáticos se interesaran Bap E 
mente en el teorema del minimax. El p io E 
juegos de persecución y evasión en los cua Él un pr 
loto trata de evadirse de un misil detector e ca p 
ciertamente constituye un interesante e z 
la teoría del control, pero por su naturaleza, 
ejercicio refuerza los prejuicios de los a ol a 
sionados con la idea de que los teóricos de los D 
gos son ciborgs locos. Tampoco es probable wa 
popularidad de la teoría de juegos se n E 
tada por el abstruso hallazgo de que el teore 
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minimax sólo puede ser cierto en determinados 
juegos infinitos si estamos dispuestos a negar el 
Axioma de la Elección. La teoría de Juegos habría 
encontrado una Mayor aceptación en sus primeros 


años si sus entusiastas no la hubieran hecho parecer 
tan difícil. 


Piedra-papel-tijera 


Todos los niños conocen este Juego. Simultánea- 
mente, Alice y Bob hacen un gesto con la mano que 
representa una de sus tres estrategias puras: piedra, 


papel, tijera. El ganador se determina de acuerdo 
con estas normas: 


piedra rompe tijera 
tijera corta papel 
papel envuelve piedra 


Si ambos jugadores hacen el mismo gesto, el re- 
sultado es empate; el Juego es considerado por am- 
bos jugadores como equivalente a una lotería en la 
que la probabilidad de ganar y la de perder son igua- 
les, de modo que se trata de un juego de suma cero. 

Es obvio que para cada Jugador la estrategia ra- 
cional consiste en emplear cada una de las estrate- 
gias puras con la misma frecuencia. Entonces cada 
uno se garantiza un pago maximin de cero. El prin- 
cipal interés del juego radica en que hay que trabajar 


UVA ERTE 57 


muy duro para encontrar un proceso evolutivo que 
converja hacia esta solución. 

Por ejemplo, las dinámicas de la mejor respuesta 
posible que muestra la Figura 9 acaban formando 
ciclos de tal forma que periódicamente casi se elimi- 
na cada una de las estrategias cada vez. Uno puede 
despreciar este resultado como curiosidad si no fue- 
ra porque la mezcla de población de las tres varieda- 
des de salamandra centroamericana que juega a un 
juego como Piedra-papel-tijera también acaba dis- 
curriendo por ciclos similares, de modo que siempre 
hay una variedad que parece al borde de la extin- 
ción. 


El Juego de Cartas de O’ Neill 


Barry O'Neill se sirvió de este juego en el primer 
experimento de laboratorio que halló evidencia 
positiva del principio del maximin. Los primeros 
experimentos habían resultado desalentadores; el 
eminente psicólogo William Estes fue especialmen- 
te mordaz cuando informó sobre su prueba de la 
teoría de Von Neumann: «La teoría de Juegos no 
será un sustituto para una teoría del comporta- 
miento de base empírica cuando queramos prede- 
cir lo que la gente realmente hará en situaciones 
competitivas». 

No obstante, en el experimento en el que Estes 
basó sus desdeñosos comentarios sólo participaron 
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dos sujetos, que tenían experiencia en los experi- 
mentos de refuerzo del aprendizaje que Estes estaba 
empleando para defender la ya desacreditada teoría 
de la «igualación de probabilidades». Ninguno de 
los sujetos sabía que participaba en un juego con 
otra persona. Aunque hubieran sabido que jugaban 
a un juego, la teoría del minimax habría sido irrele- 
vante para su delicada situación, ya que no se les ex- 
plicó de antemano cuáles eran los pagos del juego. 
Por consiguiente, jugaban con información incom- 
pleta, situación en la que no se aplica la teoría del 
minimax de Von Neumann. 

Al diseñar un experimento sin dichos errores, 
O'Neill quería establecer controles por si los jugado- 
res podían plantear diferentes actitudes hacia el ries- 
go. Por ejemplo, Piedra-papel-tijera no sería de suma 
cero a menos que tanto Alice como Bob pensaran 
que empatar es equivalente a ganar o perder con la 
misma probabilidad. De modo que O'Neill experi- 
mentó con un Juego con el que solamente se ganaba 
o perdía, pero que estaba lo suficientemente estruc- 
turado como para que la solución no fuera obvia. 

Tanto Alice como Bob tienen el as y las figuras de 
uno de los palos de una baraja de cartas. Muestran 
simultáneamente una carta. Alice gana si los dos 
muestran un aso si las cartas no coinciden. En cual- 
quier otro caso, gana Bob. 

La estrategia maximin de Alice se alcanza pregun- 
tándose cuál de sus estrategias mixtas hace que Bob 
sea indiferente ante todas sus propias estrategias pu- 
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tas. La respuesta es que Alice debería sacar todas las 
liguras con la misma frecuencia y el as el doble de 
veces. Bob debería hacer lo mismo, con el resultado 
de que Alice ganaría dos quintas partes de las veces 
por tres quintas partes de Bob. 


Fl Duelo 


El Juego del Duelo es lo más cercano a una aplica- 
ción militar que vamos a analizar. Alice y Bob cami- 
nan el uno hacia el otro armados cada uno con una 
pistola cargada con una sola bala. La probabilidad 
de que uno acierte al disparar se incrementa a medi- 
da que se acercan. Los pagos de cada jugador consis- 
ten en su probabilidad de sobrevivir. 

¿Cuánto debería acercarse Alice a Bob antes de 
disparar? Literalmente, es cuestión de vida o muer- 
te, puesto que si dispara y falla, Bob podrá avanzar y 
disparar a bocajarro, con consecuencias fatales para 
Alice. Dado que alguien muere en cada posible re- 
sultado del juego, los pagos siempre suman uno. 

La conclusión es obvia. No puede ser un equili- 
brio de Nash que un jugador planee disparar antes 
que el otro, porque sería una mejor respuesta para el 
jugador que planea disparar antes esperar un instan- 
te más. Pero ¿cuánto más se habrán acercado cuan- 
do abran fuego a la vez? 

El teorema minimax ofrece una respuesta directa 
a esta pregunta. El Duelo es un juego de suma unita- 
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ria en lugar de suma cero, pero el teorema minimax 
también se aplica (si los pagos siguen sumando uno 
cuando los jugadores disparan a la vez). La única di- 
ferencia es que los pagos maximin de los jugadores 
ahora suman uno en lugar de cero. De modo que si 
Alice siempre tiene el doble de posibilidades de acer- 
tar el tiro que Bob, ambos dispararán a aquella dis- 
tancia a la que la bala de Alice alcance a Bob dos ter- 


cios de las veces y la de Bob alcance a Alice un tercio 
de las veces. 


at 


3, Tiempo 


Juegos con información perfecta 


A veces la gente cree que es frívolo hablar sobre 
problemas sociales humanos como si fueran meros 
juegos de mesa. La ventaja radica en que casi todo 
el mundo es capaz de pensar desapasionadamente 
en las cuestiones estratégicas que surgen de juegos 
como el Ajedrez o el Póquer, sin rechazar automática- 
mente una conclusión si no resulta bienvenida. Pero 
la lógica es la misma se aplique donde se aplique. 


Juegos de mesa 


A primera vista, no parece que el Ajedrez o el Pó- 
quer’ puedan representarse en tablas de pagos, por- 


|. Al igual que en el original, cuando un juego, ya se trate del 
ajedrez o del dilema del prisionero, se analiza en su dimensión 
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que el tiempo entra en escena. No solamente impor- 
ta quién hace qué; también importa en qué momen- 
to lo hace. 

Parte de la diferencia es ilusoria. En el caso gene- 
ral, una estrategia pura es un plan de acción que le 
indica al jugador qué hacer ante todas las contingen- 
cias que pudieran surgir en el Juego. Por lo tanto 
puede preverse que los jugadores elijan una sola es- 
trategia de una vez y para siempre al principio del 
Juego, y a partir de ahí deleguen el desarrollo del Jue- 
go en un robot. La forma estratégica de Ajedrez re- 
sultante tendrá el mismo aspecto que el Juego del 
Gallina o la Guerra de Sexos, excepto en que su tabla 
de pagos será de suma cero y tendrá una cantidad in- 
mensamente mayor de filas y columnas. 

Von Neumann sostenía que lo primero que hay 
que hacer en cualquier juego es reducirlo a su for- 
ma estratégica, a la que por esta razón llamó «forma 
normal». No obstante, el caso del Ajedrez deja cla- 
ro que esta propuesta no siempre es muy práctica, ya 
que ¡tiene más estrategias puras que el número esti- 
mado de electrones en el universo conocido! Aun 
cuando la forma estratégica no es irremediablemente 
poco práctica, a menudo es mucho más fácil calcular 
los resultados mediante la Jorma extensiva del juego. 

Los expertos en teoría de Juegos emplean la ana- 
logía del árbol para describir un Juego en forma ex- 


estratégica, de incentivos, jugadores y pagos, se empieza en ma- 
yúscula. (N. del T.) 
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tensiva. Cada movimiento corresponde a un punto 
lanado nodo, de donde salen ramas. La raíz del ár- 
bol corresponde al primer movimiento del juego. 
Las ramas de cada nodo corresponden a las decisio- 
nes que pueden tomarse en ese movimiento. Las ho- 
jas del árbol corresponden a los resultados finales 
del juego, de modo que hay que establecer quién 
consigue qué pagos en cada hoja. También hay que 
establecer qué jugador mueve en cada nodo y qué 
sabe el jugador sobre lo que ha pasado hasta enton- 
ces en el juego cuando efectúa el movimiento. 

lin el Póquer, el primer movimiento es llevado a 
cabo por un jugador ficticio llamado Suerte, que ba- 
raja y reparte las manos de cartas que reciben los 
verdaderos jugadores. Lo que los jugadores saben 
sobre este movimiento es extremadamente impor- 
tante, ya que el juego carecería de interés si todos su- 
pieran las cartas que han recibido los demás. No 
obstante, dejaremos los juegos de información im- 
perfecta como éste para el capítulo siguiente. Todos 
los juegos de este capítulo serán juegos con informa- 
ción perfecta, en los cuales nada de lo que ha pasado 
en cl juego hasta un determinado momento se les 
esconde a los jugadores cuando llevan a cabo un 
movimiento. Tampoco analizaremos juegos con in- 
tormación perfecta que, como el Duelo, contienen 
movimientos con resultados aleatorios. Por lo tanto, 
cl Ajedrez es el ejemplo arquetípico de este capítulo. 
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Retroinducción 


La retroinducción es un tema polémico, pero todo el 
mundo está de acuerdo en que siempre podríamos 
emplearla para encontrar los valores maximin de los 
Jugadores en un juego finito de información perfec- 
ta st tuviéramos un ordenador lo suficientemente 
potente y dispusiéramos del tiempo necesario. Con 
una palanca lo suficientemente larga y un punto de 
apoyo, Arquímedes tenía razón en términos simila- 
res cuando decía que podría mover el mundo. Apli- 
car la retroinducción al Ajedrez ilustra tanto sus vir- 
tudes teóricas como sus defectos en la práctica. 


Ajedrez 


Etiqueta cada una de las hojas del juego de Ajedrez 
CON GANAR, PERDER O TABLAS, según el resultado 
del jugador con las blancas. Ahora toma cualquiera 
de los penúltimos nodos (en los que cada decisión 
lleva inmediatamente a una hoja del árbol). Hay 
que encontrar la mejor decisión para el jugador que 
mueve en ese nodo. Marca el penúltimo nodo con 
la etiqueta de la hoja a la que lleva esa decisión. Fi- 
nalmente, desecha todo el árbol que sigue al penúl- 
timo nodo, que en este momento se convierte en 
hoja de un árbol menor en el que los valores maxi- 
min delos jugadores no cambian. 

Ahora hay que hacer lo mismo una y otra vez, 
hasta que sólo queda una etiqueta pegada a la raíz 
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del arbol original. La etiqueta es el resultado maxi- 
min de las blancas. 

No importa lo potentes o rápidos que puedan lle- 
gar a ser los ordenadores porque nunca serán capa- 
ves de completar este programa con el Ajedrez, ya 
que se tardaría demasiado. Así que probablemente 
nunca sabremos la solución del Ajedrez. Pero, al me- 
nos, se ha establecido que, a diferencia del Bigfoot o 
el Monstruo del Lago Ness, sí existe realmente una 
solución para el Ajedrez. 

Si el resultado maximin del jugador con las blan- 
cas ES GANAR, tiene una estrategia pura que le garan- 
tiza una victoria contra cualquier estrategia defensi- 
va de las negras. Si el resultado maximin de las 
blancas es PERDER, las negras tienen a su disposición 

una estrategia pura que les garantiza una victoria 
contra toda defensa de las blancas. No obstante, la 
mayoría de expertos vaticinan que los resultados 


P 


Hex 


¿Ajedrez? 


FIGURA 10. Dos juegos de mesa. 
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maximin de las blancas son TABLAS, lo que significa 
que tanto las blancas como las negras tienen estrate- 
tas Puras para garantizar un empate contra toda 
defensa de su adversario. 

Por lo tanto, si estos expertos están en lo cierto, la 
forma estratégica del Ajedrez tiene una fila donde 
todos los resultados son GANAR O TABLAS y una co- 
lumna en la que todos los pagos son PERDER O TA- 
BLAS, COMO muestra la Figura 10. Sin el argumento 
de la retroinducción, no estoy seguro de que este he- 
cho resultara obvio en absoluto. 


Hex 


Piet Hein inventó este Juego en 1942. Lo reinventó 
Nash en 1948. Se dice que tuvo la idea al contemplar 
los azulejos hexagonales del lavabo de caballeros del 
Departamento de Matemáticas de Princeton. De he- 
cho, los azulejos eran hexagonales, pero Nash me ha 
contado que no recuerda que fueran en absoluto 
inspiradores. 

El Hex es un juego de negras contra blancas en un 
tablero de hexágonos dispuestos en forma de para- 
lelogramo, como en la Figura 10. Al principio del 
Juego, el territorio de cada Jugador consiste en dos 
lados opuestos del tablero. Los jugadores mueven 
por turnos y empiezan las blancas. El movimiento 
consiste en situar una de las fichas en un hexágono 
vacío. El ganador es el primero que enlaza los dos la- 


ES 


LENIE o; 


dos del tablero, de modo que en el juego recién aca- 
bado que muestra la Figura 10 ganan las negras. 

Como en el Ajedrez, teóricamente podemos cal- 
cular los pagos maximin de los jugadores mediante 
la retroinducción, pero el método no resulta prácti- 
co cuando el tablero es grande. No obstante, sabe- 
mos que el pago maximin de las blancas es GANAR. 
ls decir, el primer jugador que mueve dispone de 
una estrategia que le garantiza la victoria contra 
toda defensa que le oponga el segundo jugador. 
¿Cómo lo sabemos? 

En primer lugar, hay que destacar que el Hex no 
puede acabar en empate. Para entenderlo, hay que 
pensar en las fichas negras como agua y en las fichas 
blancas como tierra. Cuando todos los hexágonos 
están ocupados, o bien el agua fluirá entre los dos la- 
gos que originalmente pertenecían a las negras o el 
canal entre ellos estará bloqueado. Las negras ven- 
cen en el primer caso, y las blancas en el segundo. Así 
que o las negras o las blancas tienen una estrategia 
ganadora. 

Nash inventó un argumento robaestrategias para 
mostrar que el ganador debe ser Blanco. El argu- 
mento consiste en una contradicción. Si las negras 
fueran a jugar una estrategia ganadora, las blancas 
podrían robársela mediante las reglas siguientes: 


l. Pon tu primera ficha en cualquier casilla. 
2. En movimientos posteriores, haz como si la 
primera ficha que has puesto no estuviera en el 
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tablero. A continuación, imagínate que todo el 
resto de fichas blancas son negras y que todas 
las fichas negras son blancas. 

3. Efectúa el movimiento que harían las negras 
en esta posición si emplearan su estrategia da 


nadora. Si ya tienes una ficha en esta posición 
; 3 
mueve a otra casilla. 


| Esta estrategia te garantiza una victoria, porque 
simplemente haces lo que le garantiza una victoria a 
las negras, pero con un movimiento de antelación 
La presencia en el tablero de una ficha blanca adicio- 
es puede hacer que ganes antes de lo que lo habrían 
e Negras, ¡pero supongo que no te quejarás 
Dado que los dos Jugadores no pueden ser el ga- 
nador, nuestro supuesto de que las negras tienen 
una estrategia ganadora debe estar equivocado 
Por consiguiente, el ganador es el jugador de las 
blancas, aunque conocer este hecho no le ayudará 
mucho cuando juegue al Hex en un tablero gran- 
Sl ya que encontrar la estrategia ganadora de las 
o es un problema por resolver en un caso ge- 
Hay que tener en cuenta que el argumento del 
robo de la estrategia no nos dice nada sobre la verda- 
dera estrategia ganadora de las blancas. Ciertamente 
no tienen la victoria garantizada tras haber coloca- 
do la primera ficha en cualquier sitio. Si pones la pri- 
mera ficha en una esquina del tablero, probable- 
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mente podrás ver por qué las negras tienen una es- 
trategia ganadora para el resto del juego. 

También puede resultar divertido poner a prueba 
tu capacidad de razonamiento con una versión del 
Hex que unos matemáticos de Princeton supuesta- 
mente empleaban para tomarles el pelo a sus visi- 
tantes. Se añade una línea extra de hexágonos, de 
forma que los dos lados de las blancas del tablero se 
separan más que los de las negras. En el nuevo juego, 
no solamente son las negras las que tienen una es- 
trategia ganadora, sino que podemos escribirla. No 
obstante, cuando los visitantes jugaron con las blan- 
cas contra el ordenador, en la pantalla el tablero se 
mostraba en perspectiva para disfrazar su asimetría. 
Así que ¡los visitantes pensaban que estaban jugan- 
do al Hex normal; para su consternación y frustra- 

ción, de un modo u otro siempre ganaba el ordena- 


dor! 


Borrar estrategias dominadas 


Cada vez que se desechan un montón de decisiones 
de un nodo al realizar una retroinducción, se está 
descartando un montón equivalente de estrategias 
puras. Desde el punto de vista de la forma estratégl- 
ca del juego que has alcanzado en esa fase, cualquier 
estrategia que se descarta está dominada por una es- 
trategia exactamente igual excepto porque pide que 
se tome la mejor decisión en el nodo en cuestión. 
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Si excluimos el caso en el que dos estrategias 
siempre comportan el mismo pago, una estrategia 
está dominada por otra si en ningún caso ofrece un 
pago mayor que el de ésta, independientemente de 
las estrategias que puedan emplear los demás juga- 
dores. En el Dilema del Prisionero, halcón domina 
sobre paloma (pero no en el Juego de la Caza del 
Ciervo de la Figura 18). 

Por lo tanto, podemos imitar la retroinducción en 
un juego borrando sucesivamente las estrategias do- 
minadas en su forma estratégica. A veces con este 
método se puede reducir la forma estratégica a un 
solo resultado aunque no se imite la retroinducción 
El resultado siempre será un resultado Maximin si el 
Juego es de dos jugadores y suma cero. Pero ¿qué ha 
de los juegos en general? f 

Todo equilibrio de Nash de un juego conseguido 
mediante la eliminación de estrategias dominadas 
de un Juego mayor también tiene que ser un equili- 
brio de Nash del juego mayor. Ello se debe a que 
añadir una estrategia dominada a tus opciones en el 
Juego no puede convertir ninguna de tus actuales es- 
trategias en algo peor. A veces se pueden perder 
equilibrios de Nash cuando se borran estrategias do- 

minadas (a menos que todas las dominaciones sean 
estrictas), pero nunca pueden eliminarse todos los 
equilibrios de Nash del juego original. 


4 
| 


7I 
Jurgos de adivinar 


Si Alice opera en el mercado de valores, espera que 
aumente el valor de las acciones que compra. Dado 
que el valor futuro de éstas depende de lo que otra 
gente piense de ellas, los inversores como Alice real- 
mente invierten en los fundamentos de sus creencias 
sobre las creencias de otras personas. Si Bob planea 
beneficiarse de inversores como Alice, tendrá que te- 
her en cuenta sus creencias sobre lo que ella cree que 
los otros creen. Si queremos beneficiarnos de Bob, 
necesitaremos preguntarnos qué creemos que Bob 
cree que Alice cree sobre lo que creen los demás. 

Fue célebre el uso por parte de John Maynard 
Keynes de los concursos de belleza organizados por 
los periódicos de su época para ilustrar cómo estas 
cadenas de creencias se alargan más y más cuanto 
más se piensa en el problema. El objetivo de dichos 
concursos consistía en elegir a la chica elegida por el 
máximo número de personas. Los expertos en teoría 
de juegos prefieren un juego de adivinar más simple 
cuyos ganadores son aquellos jugadores que elijan el 
número más cercano a dos tercios de la media de to- 
dos los números elegidos. 

Si los jugadores están limitados a números ente- 
ros del 1 al 10, ambos inclusive, elegir un número 
por encima de 7 es una estrategia dominada, porque 
la media como mucho puede ser de 10, y ?/, x 10 = 
6 >/,. Por lo tanto, siempre incrementas tus posibili- 
dades de ganar si juegas 7 en lugar de 8,9 o 10. Pero 
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si todo el mundo lo sabe, nadie jugará jamás a una 
estrategia dominada, por lo que nos encontramos 
en un juego cuyos jugadores eligen un número entre 
l y 7, ambos inclusive. La media de este juego puede 
ser como máximo de 7, pero /x7=4 h. De modo 
que elegir un número por encima de 5 es una estra- 
tegia dominada. 

Es obvio adónde conduce este argumento. Si es de 
todos sabido que ningún jugador empleará una es- 


trategia dominada, todos los Jugadores deben elegir 
el número 1. 


De todos sabido 


Algo es de todos sabido si todos lo saben, todos sa- 
ben que todos lo saben, todos saben que todos saben 
que todos lo saben, etcétera. Si no se dice lo con- 
trario, en el análisis racional de un Juego existe el 
supuesto implícito de que tanto el Juego como la ra- 
cionalidad de los jugadores son conocidos por to- 
dos. De otro modo, no tendríamos derecho a usar la 
idea del equilibrio de Nash para incurrir en infinitas 
regresiones de la forma: «Alice cree que Bob cree que 
Alice cree que Bob cree...». 

Una vez vi un concurso de preguntas llamado El 
precio justo, en el cual los tres concursantes intentan 
adivinar el valor de una antigúedad. El que se acer- 
que más al valor real es el ganador. Si el último con- 
cursante piensa que el valor es mayor que el dado 


7A 
NRE Y 
j bería in- 
por las otras dos propuestas, obviaMente — dein 
«rementar la propuesta más alta en no qee a 
dólar. Dado que no es esto lo re id e 
tontería intentar aplicar la teoría Ea do ancla: 
, S Dien sabi 

EEEN T to de que e 
cursos bajo el supues h 

. or lo tanto, hay que 
ORES cionales. P 
concursantes son ra e ? a 
agradecer que la interpretación A de la 

l an fuertes. 

de juegos no requiera supuestos fue 


Perfección en el subjuego 


Daniel Ellsberg es conocido por Poner al e 
to la dirección de la guerra de Vietnam por eN 
gobierno de Nixon cuando filtró los ea de T i 
tágono al periódico New York Times en i a ; n 
En una encarnación anterior, prOPuso el Jueg 


Secuestro. 


Secuestro 


Alice ha secuestrado a Bob. La E a ha o 
ahora la cuestión es si debería li a O e n 
Alice preferiría liberar a Bob si a o i o 
S í identidad, Bo 

de que éste no revelaría su 1 p 
tido no decir nada, pero ¿pued£ Alice confiar e 

dalabra? en 
| La Figura 11 muestra el árbol de Ena del a 
cuestro junto con la correspondiente tabla de pagos. 
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callar hablar 


asesinar 


hablar 


Bob 


asesinar 
Alice 


FIGURA 11. Secuestro. 


Marcar las mejores respuestas revela que sólo hay un 
equilibrio de Nash, en el cual Alice asesina a Bob 
porque predice que hablará si le libera. 

Borrar estrategias dominadas nos lleva al mismo 
equilibrio de Nash. Para Bob, la estrategia hablar 
siempre es al menos tan buena o más que silencio. 
Así que el primer paso es borrar silencio. En lo que 
queda de juego, la estrategia asesinar de Alice siem- 
pre es tan buena o más que liberar (porque Bob sola- 
mente puede jugar hablar en el juego reducido). De 
modo que nos queda solamente un equilibrio de 
Nash (asesinar, hablar). 

Borrar las estrategias dominadas de este modo se 
corresponde con emplear la retroinducción en el ár- 
bol de decisión. Primero hay que engrosar la rama 
del árbol de decisión que representa la mejor elec- 
ción de Bob, hablar. A continuación, hay que olvidar 
por completo que la elección inferior de Bob existe y 
engrosar la rama que representa la mejor decisión de 
Alice en el juego restante, asesinar. Ahora puede ver- 
se el camino de equilibrio que se seguirá cuando Ali- 
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ce y Bob jueguen el equilibrio de Nash (asesinar, ha- 
blar). En este caso, una sola rama engrosada vincula 
la raíz del juego con una hoja; en un juego más ex- 
tenso, el camino de equilibrio consistiría en toda 
una secuencia de ramas engrosadas que vinculan la 
raíz a una hoja. 

En los juegos de información perfecta como el del 
Secuestro, la retroinducción siempre conduce a es- 
trategias que no sólo son equilibrios de Nash en el 
juego en general, sino también en todos sus subjue- 
gos -ya estén en la ruta de equilibrio o no—. Reinhard 
Selten compartió un Premio Nobel con Nash en 
parte por introducir este tipo de equilibrios. Al prin- 
cipio los denominó «perfectos», pero más tarde 
cambió de idea sobre lo que debería significar «per- 
fección». Así que ahora los llamamos equilibrios de 
perfección en el subjuego. 


Contrafácticos 


A los políticos les gusta hacer creer que las pregun- 
tas hipotéticas no tienen sentido. Como dijo George 
Bush padre en 1992 al contestar a una pregunta im- 
pecablemente razonable sobre los subsidios de de- 
sempleo: «si una rana tuviera alas, no podría golpear 
el suelo con su cola». Pero el Juego del Secuestro 
muestra por qué las preguntas hipotéticas son la 
sangre vital de la teoría de juegos, al igual que debe- 
rían ser la sangre vital de la política. 
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Los ju 
A mi sl racionales se ciñen a sus estrategias 
ibr | 
10, por lo que predicen qué ocurriría si se 


c 

o cruza la carretera? Porque predice que, si] 
IcIera, sería atropellada. ¿Por ué E 

en el Juego del Secuestro? Po a 
n el ? Por 

ria si no lo hiciera. AE: 

Por : Í 

E lo tanto, que pasaría en subjuegos a los que no 
i st resulta relevante. iSi no se llega a ellos 

POr lo que pasaría si se llegara a ellos! Ñ 


¿Cambiar el juego? 


L is ; 
a a las víctimas de un se- 
to nten establecer y desarrollar Una re- 
ra con sus captores. Si de este modo 

Pudiera persuadir a Alice de que se preocupa lo 


cuestro Agradable. 


Como muestra la Ej 
> “a Elgura 12, el Secuestro A 
ble tiene dos equilibrios de Nash con E i 


sisi 
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LEMPO 


hablar 


callar 


liberar 


Asesinar 


Alice 


FIGURA 12. Secuestro Agradable. 


ras: (asesinar, hablar) y (liberar, callar). El equilibrio 
(asesinar, hablar) ya no es perfecto en el subjuego, 
porque exige que Bob elija la opción inferior, hablar, 
en el subjuego al que no se llega en equilibrio porque 
Alice realmente elige asesinar, pero que se alcanzaría 
si Alice eligiera liberar en su lugar. 

No obstante, este nuevo equilibrio (liberar, callar) 
es perfecto en el subjuego. Por consiguiente, es este 
el equilibrio que se jugará, siempre que Alice sea ra- 
cional y sepa que Bob es racional. Si los pagos se eli- 
gen de acuerdo con la teoría de las preferencias reve- 
ladas, resultaría tautológico que Bob eligiera callar 
en lugar de hablar si Alice eligiera liberar. Por consi- 
guiente, Alice decidirá liberar porque sabe que com- 


portará unos pagos mejores que asesinar. 
La moraleja es que la racionalidad a veces nos dice 


más que simplemente «Alice y Bob deben elegir un 
equilibrio de Nash». 
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El Juego del Ultimátum 


el tema. E i 
a experimento consistía en observar si en la 
ado Pe sente jugaría el equilibrio de perfección 
uego en el Juego del Ultima 
ñ timátu 
Ko que no lo harían. Y tenía razón dia 
u imá 
Eo del Ultimátum es un primitivo juego de 
a o en el cual un filántropo de mente es 
a donado una suma de dinero a re m 
a E y Bob si se ponen de acuerdo en 2 di- 
o - Las reglas especifican que Alice le hace pri 
al E Propuesta a Bob sobre cómo a I 
O. Este puede aceptar] : 
i a o rechazarla. Si 
eds P arla. Si la acep- 
e ne la propuesta de Alice. Si la rechaza a 
80 se acaba sin que los jugadores se lleven nada 


dirá que sí 
E 
a e puesto que cualquier suma es mejor que 
. Por i 1x1 
consiguiente, lo máximo que Alice A 


dinero. 
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No obstante, los experimentos de laboratorio 
muestran que en la realidad los individuos a menu- 
de juegan con justicia. La propuesta más probable es 
un reparto del 50% para cada uno. Las propuestas 
de un reparto injusto, como un 70% contra 30%, 
son rechazadas la mayoría de las veces, aunque el 
que responde no consigue nada en absoluto. Éste es 
el resultado más repetido en la economía experi- 
mental. Yo mismo lo he repetido varias veces. No 
cambia cuando se incrementan las sumas en juego. 
Se mantiene incluso en países donde los pagos en 
dólares constituyen una fracción significativa de la 
renta anual de los individuos. El resultado no es 
completamente universal, pero hay que seguir a los 
antropólogos hasta partes remotas del mundo para 
encontrar excepciones. 

Una nueva escuela de economistas del compor- 
tamiento usa este resultado como palo con el que 
golpear a sus rivales tradicionales. Explican que los 
datos desmienten el «axioma del egoísmo» de la 
economía ortodoxa. El desafío que plantean se diri- 
ge, pues, a la hipótesis de que la gente sólo se preo- 
cupa por el dinero en lugar de por la lógica de la re- 
troinducción. 

En realidad, que las personas sean egoístas recal- 
citrantes no es un axioma de la economía. La orto- 
doxia está representada por la teoría de las preferen- 
cias reveladas. Todo el mundo está de acuerdo en 
que el dinero no lo es todo. Hasta Milton Friedman 
solía ser cariñoso con los animales y donar dinero a 


80 
LA TEORIA DE JUEGOS. UNA BREVE INTRODUCCIÓN 
? a 
a caridad. Pero también es verdad que existe un nú- 
m i 
ero inmenso de experimentos que muestra que en 
a Ta de laboratorio la mayoría de los sujetos al 
in 1 
: ; sí acaban comportándose como si su principal 
n n consistiera en maximizar sus pagos en dóla- 
res. E Dilema del Prisionero es la norma más que la 
excepción. Así que, ¿qué isti 
; , ¿qué hace distinto al 
Ultimátum? ida 
Sa que la respuesta se encuentra en el hecho de 
aa interpretaciones racional y evolutiva de un 
E le 
Po ibrio divergen al aplicarse a equilibrios de per- 
ección en el subjuego. 


El Minijuego del Ultimátum 


En esta versión simplificada del Juego del Ultimá- 
tum, el filántropo dona 4 dólares. Alice le puede ha- 
cer a Bob una propuesta justa o injusta. La oferta 
Justa consiste en repartir el dinero equitativamente 
mitad y mitad. Bob acepta automáticamente la ofer- 
ta Justa, pero tiene la opción de aceptar o rechazar la 
oferta injusta, que le asigna a Alice 3 dólares y a Bob 
solamente 1 dólar. La Figura 13 muestra el árbol de 
decisión y la tabla de pagos del Minijuego del Ulti- 
matum. Este análisis es el mismo del Secuestro 
Agradable, aunque en este caso la lógica del argu- 


Es . 
i ento es controvertida porque a sus detractores no 
es gusta adónde conduce. 


8l 


w FIE SAPEI 


justa 


pusta injusta injusta |N 


Alice 


FiuRA 13. Minijuego del Ultimátum. Aparte de las etiquetas 
de las acciones posibles y de algunos cambios sin consecuencias 
en los pagos, el juego es el mismo que el del Secuestro Agradable. 


El equilibrio de perfección en el subjuego es (1n- 
justa, sí). Como el Secuestro Agradable, el juego tie- 
ne otro equilibrio de Nash: (justa, no). De hecho, 
tiene muchos equilibrios de Nash en los que Alice 
clige justa porque Bob planea usar una estrategia 
mixta en la que dice no a una oferta injusta con una 
probabilidad lo suficientemente alta. 

La razón para preocuparse por los equilibrios de 
Nash que no sean de perfección en el subjuego es 
que no hay motivos para suponer que un proceso 
evolutivo necesariamente convergerá en el equili- 
brio de perfección en el subjuego. Si los sujetos están 
aprendiendo por ensayo y error qué equilibrio jugar, 

podrían aprender a jugar cualquier equilibrio de 
Nash del Minijuego del Ultimátum. 

La Figura 14 muestra dos procesos evolutivos del 
Minijuego del Ultimátum. Uno consiste en la diná- 
mica de la mejor respuesta que ya hemos analizado 
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nunca 
Si 
siempre 
baja 


siempre siempre 


alta baja siempre 


alta 


nada no, pero N todavía ti 


anteriormente; el otro es una dinámica del replica- 
dor, más compleja, que normalmente es considera- 
da un mejor modelo básico de un proceso de ajuste 
(véase Estabilidad Evolutiva, Capítulo 8). 

La dinámica de la mejor respuesta converge en el 
equilibrio de perfección en el subjuego, pero ello no 
ocurre necesariamente en la dinámica del replica- 
K e de equilibrios de Nash en e que 
de a de e tiene una gran cuenca de atracción 

A la evolución no le importa que la elección de no 
por parte de Bob sea débilmente dominada en tod 
estos equilibrios. Es verdad que el sí siempre es n 
Jor que el no en el caso de que Alice juegue injusta de 
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ves en cuando, pero la presión evolutiva contra in- 
justa puede ser tan fuerte que desaparezca del todo. 
Una vez desaparecida, no puede sobrevivir, porque 
entonces Bob es indiferente entre sí y no. 


Convenciones justas 


Ahora tenemos una explicación para los datos expe- 
rimentales del Juego del Ultimátum que no necesita 
asignar a los jugadores preferencias distintas de las 
que revelan cuando juegan al Dilema del Prisionero 
en el laboratorio. 

En la vida real, Bob sería estúpido si cediera ante 
una oferta injusta, porque no puede permitirse ad- 
quirir la reputación de ser un blando. Por consi- 
guiente, aplicamos una convención por la cual Alice 
a menudo es rechazada si hace una oferta injusta. 
Los sujetos llevan esta convención al laboratorio sin 
darse cuenta de que coordina un equilibrio en el jue- 
go de la vida, o de que el juego al que les piden que 
jueguen en el laboratorio es muy distinto de los jue- 
gos de la vida real para los que está adaptada la con- 
vención. 

Cuando los sujetos comienzan jugando con justi- 
cia en el Dilema del Prisionero, las presiones evoluti- 
vas empiezan inmediatamente a modificar su com- 
portamiento, porque el único equilibrio de Nash del 
Dilema del Prisionero evita cualquier tipo de coope- 
ración. El Juego del Ultimátum difiere del Dilema 
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del Prisionero en que tiene muchos equilibrios de 
Nash. Cualquier reparto del dinero disponible se co- 
rresponde con un equilibrio de Nash, por la misma 
razón por la que esto se cumple en el Minijuego del 
Ultimátum. Cuando Alice y Bob empiezan jugando 
con Justicia en el Juego del Ultimátum, no existen 
presiones evolutivas evidentes que los conduzcan 
hacia el equilibrio de perfección en el subjuego. Por 
consiguiente, no hay necesidad de inventar una ra- 
ZÓn para explicar que no se muevan mucho de don- 
de empezaron. 

Los teóricos de los juegos se sienten felices de que 
los economistas del comportamiento argumenten 
en contra del egoísmo. ¿Cómo si no explicaríamos 
por qué Milton Friedman contribuía a obras de cari- 
dad? Pero cometen dos errores al afirmar: «La teoría 
de Juegos predice el equilibrio de perfección en el 
subjuego en el Juego del Ultimátum». El primero es 
que la teoría de juegos asume que los jugadores ne- 
cesariamente maximizan el dinero. El segundo es 
que la teoría de juegos racional y evolutiva siempre 
predice lo mismo. 


Refinamientos 


La evolución no siempre elige los equilibrios de per- 
fección en el subjuego, pero para Alice sigue siendo 
racional resolver el Minijuego del Ultimátum por 
retroinducción cuando los pagos se determinan me- 
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diante la teoría de las preferencias reveladas. El su- 
puesto estándar de que Alice sabe que Bob es racio- 
nal resulta esencial para este fin, porque Alice nece- 
sita estar segura de que el comportamiento de Bob 
será coherente con los pagos a él asignados. 

¿Implica nuestro supuesto estándar que la racio- 
nalidad de los jugadores es conocida por todos 
y que se seguirá un camino hacia el equilibrio de 
perfección en el subjuego en cualquier juego fini- 
to con información perfecta? Bob Aumann dice que 
sí, y cabría pensar que debería saberlo, dado que 
ganó un Premio Nobel en parte por convertir lo 
que es conocido por todos en una herramienta 
operativa. Pero ejemplos como el de la Cadena de 
Establecimientos de Selten mantienen abierta la 


cuestión. 


La paradoja de la Cadena de Establecimientos 


El Minijuego del Ultimátum puede reinterpretarse 
como un juego en el cual Alice amenaza con abrir 
una tienda en una ciudad donde Bob ya dirige un es- 
tablecimiento similar. Sólo tenemos que rebautizar 
las estrategias de Alice como fuera y dentro y las de 
Bob como aceptarlo y luchar. Luchar consiste en ini- 
ciar una guerra de precios, que es perjudicial para 
ambos jugadores. La paradoja de Selten surge cuan- 
do Bob dirige una cadena de establecimientos en 
cien ciudades y Alice es sustituida por cien posibles 
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rivales que amenazan con establecer una tienda rival 
en cada ciudad. 

Al igual que en el Minijuego del Ultimátum, la re- 
troinducción establece que en el centésimo Juego el 
centésimo rival entrará en el mercado y Bob lo acep- 
tará. Por lo tanto, lo que ocurre en el centésimo jue- 
go está determinado independientemente de lo que 
pasa en juegos anteriores, y el mismo argumento se 
aplica al juego nonagésimo noveno. Si continuamos 
con el razonamiento, acabamos llegando a la con- 
clusión de que el rival siempre entrará y Bob siem- 
pre lo aceptará. Pero ¿haría mejor Bob si luchara 
contra los primeros competidores para desincenti- 
var la entrada en el resto de ciudades? 

El árbol de decisión de la Figura 15 es una simpli- 
ficación con sólo dos ciudades y un solo rival, Alice. 
Si ésta entra en la primera ciudad, Bob puede con- 
formarse o luchar. Si Alice entra en la segunda ciu- 
dad, Bob de nuevo debe elegir entre conformarse o 
luchar, Si Alice no entra en la primera ciudad, sim- 
plificamos al asumir que necesariamente se queda 
fuera de la segunda. De un modo similar, si Bob 
acepta en la primera ciudad, necesariamente Alice 
entra en la segunda ciudad y Bob vuelve a aceptarlo. 

Las líneas gruesas de la Figura 15 muestran el re- 
sultado de aplicar la retroinducción. Si el gran libro 
de la teoría de juegos recomendara seguir el camino 
del equilibrio de perfección en el subjuego, para Ali- 
ce seria acertado entrar en las dos ciudades y para 
Bob conformarse las dos veces. Pero ¿siguen Alice y 
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Alice 


FIGURA 15. Una versión simplificada de la Paradoja de la Cade- 
na de Establecimientos. Aparte de las etiquetas de las acciones 
posibles, el subjuego que empieza en el segundo movimiento de 
Alice es idéntico al Minijuego del Ultimátum. 


Bob los consejos del libro? Para analizar esta pre- 
gunta, ponte en el lugar de Bob en su primer movi- 
miento. 

Alice acaba de entrar en la primera ciudad como 
recomendaba el libro, pero ¿qué haría si llegara a su 
segundo movimiento? La respuesta depende de lo 
que ella previera que Bob haría si llegara un segun- 
do movimiento. Si Alice supiera que Bob es racional, 
predeciría que éste se iba a conformar. En ese caso, 
debería entrar y en su primer movimiento Bob se 
conformaría, como exige la retroinducción. Pero 
Alice no sabía que Bob es racional en su segundo 
movimiento, ¡porque un Bob racional no habría lu- 
chado en su primer movimiento si el gran libro de la 
teoría de juegos tuviera razón sobre qué es racional! 
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Alice empieza el juego con la creencia de que Bob 
es racional, pero si éste juega de una forma incohe- 
rente con sus propias preferencias, luchando en la 
primera ciudad, la creencia de Alice será refutada. ¿Y 
quién sabe lo que podría creer después de un suceso 
contrafáctico como ése? La versión original de Sel- 
ten de la paradoja tiene 100 tiendas, porque la res- 
puesta de sentido común después de que Bob haya 
emprendido una guerra de precios en 50 ciudades es 
que probablemente también luchará en la número 
51. Pero en ese punto el argumento de la retroinduc- 
ción se desmorona. 

La paradoja no pone en duda la retroinducción 
como manera de encontrar los pagos maximin en 
Juegos de suma cero con dos jugadores. Tampoco 
pone en duda la racionalidad de la retroinducción 
en juegos como el del Secuestro o el del Utimátum. 
En cualquier caso, la creencia inicial de los jugadores 
de que todo el mundo es racional podría ser refuta- 
da si alguien fuera a apartarse del camino de equili- 
brio, pero este hecho no genera problemas en estos 
Juegos cortos. Sin embargo, ¿cómo vamos a respon- 
der a la paradoja en juegos de mayor duración? 


Errores tipográficos 


Se dice que los equilibrios de perfección en el sub- 
Juego constituyen un refinamiento del concepto del 
equilibrio de Nash. Usarlos es seguro en tanto en 
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cuanto las circunstancias hagan recomendable que 
los jugadores sigan comportándose como si fuera de 
todos sabido que son todos racionales, aunque se 
hayan llevado a cabo uno o más movimientos irra- 
cionales. Todo un bestiario de refinamientos todavía 
más sutiles se ha creado para su empleo en Juegos de 
información imperfecta. Éstos se basan en varias 
ideas diferentes sobre qué creencias tendrían senti- 
do en el caso contrafáctico de que incluso un juga- 
dor racional jugara irracionalmente. ¡S1 George 
Bush padre leyera literatura, se marearía! Afortuna- 
damente, esta fase de la historia de la teoría de jue- 
gos está definitivamente acabada —aunque los ex- 
pertos en economía aplicada siguen apelando al 
refinamiento del bestiario que más cerca esté de 
confirmar sus propios prejuicios—. 

Mi propio punto de vista sobre estos temas con- 
siste en que deberíamos seguir el enfoque de sentido 
común de Reinhard Selten, que elimina la necesidad 
de interpretar contrafáctico alguno. Recomienda 
que integremos los suficientes movimientos aleato- 
rios (chance moves) en las reglas del Juego para eli- 
minar la posibilidad de que los jugadores se encuen- 
tren a sí mismos intentando explicar lo inexplicable. 
En el más simple de dichos modelos, se asume que 
los jugadores cometen errores ocasionalmente. Sus 
manos tiemblan al aproximarse al botón racional y 
presionan un botón irracional por equivocación. Si 
se trata de errores independientes y transitorios, 
como los tipográficos, que no tienen implicaciones 
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para los errores que puedan cometerse en el futuro, 
los equilibrios de Nash del juego con errores conver- 
gen con los equilibrios de perfección en el subjuego 
del juego sin errores, sólo si permitimos una fre- 
cuencia de errores muy pequeña. 

Selten intentó rebajar el estatus de los equilibrios 
de perfección en el subjuego porque decidió que los 
límites de los equilibrios de Nash en los juegos rea- 
lizados con la mano temblorosa son los que real- 
mente merecen la consideración de perfectos. Pero 
el resto de la gente sólo reconoce que este tipo de 
equilibrios son de perfección con la mano temblo- 
rosa. 


Lapsus mentales 


La razón por la que otros teóricos de los juegos no 
estaban dispuestos a respaldar la nueva definición 
de Selten puede quizás relacionarse con las dudas 
sobre la generalidad de su historia de la mano tem- 
blorosa. Si se pretende que el análisis racional de un 
juego sea relevante para el comportamiento de la 
gente real que trata de afrontar problemas comple- 
jos de un modo inteligente, hay que enfrentarse al 
hecho de que sus errores son mucho más suscepti- 
bles de ser lapsus mentales que errores tipográficos. 

Por ejemplo, nadie consideraría razonable expli- 
car por qué el propietario de una cadena de estable- 
cimientos inició una guerra de precios sucesivamen- 


3. TIEMPO 91 


te en 50 ciudades con el argumento de que en todos 
los casos pretendía instruir a sus directores para 
conformarse ante la entrada de un competidor, pero 
por alguna razón alguien mandaba siempre por 
error el mensaje equivocado. La única explicación 
plausible es que tiene una política de oponerse a la 
entrada de competidores y, por lo tanto, es probable 
que emprenda una guerra de precios en la 51.° ciu- 
dad, sea o no una locura. 

Cuando se introducen movimientos aleatorios 
que permiten que ocurran estos lapsus mentales, los 
equilibrios de Nash del juego con errores no deben 
converger en un equilibrio de perfección en el sub- 
Juego del juego sin errores. Así que los equilibrios de 
Nash del juego sin errores no pueden ser desechados 
como irrelevantes para el análisis racional. Pero 
tampoco se trata de deshacernos de la retroinduc- 
ción. Todos los equilibrios de Nash del juego con 
errores son automáticamente perfectos en el subjue- 
go porque los errores garantizan que se llega a cada 
subjuego con una probabilidad positiva. Por lo tan- 
to, la retroinducción es una herramienta útil para 
localizar dichos equilibrios. 


¿Moraleja? 
La lección que extraigo de la controversia sobre el 


refinamiento es que los teóricos de los juegos se 
equivocaron al olvidar que su disciplina carece de 
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contenido sustantivo. Del mismo modo que no es 
asunto nuestro decir qué debería gustarle a la gente. 
tampoco lo es decir qué deben creer. Sólo podemos 
decir que si creen esto, sería incoherente no creer 
esto otro. Si no podemos analizar un juego solamen- 
te con estos principios de coherencia, hay que añadir 
al juego toda la información sobre los jugadores y su 
entorno que podamos. 


4. Convenciones 


Decidir qué equilibrio de Nash debería considerarse 
la solución racional a un juego de suma cero de dos 
jugadores no supone un problema, ya que cualquier 
par de estrategias maximin es siempre un equilibrio 
de Nash, en el cual los jugadores obtienen sus pagos 
maximin. Pero las cosas pueden cambiar mucho en 
juegos que no son de suma cero. 

Por ejemplo, en la Guerra de Sexos, el pago maxi- 
min para los dos jugadores es de dos tercios. Curio- 
samente, el resultado es el mismo que los pagos que 
ambos consiguen en el equilibrio mixto del juego, 
pero sus estrategias maximin no son estrategias de 
equilibrio. Además, los pagos de Alice y Bob en am- 
bos equilibrios puros del juego son mucho mayores 
que sus pagos maximin. Así que, ¿qué tendrían que 
hacer? 

El Juego de la Conducción deja claro que no tiene 
sentido alguno buscar una respuesta estrictamente 
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racional. Cualquier posible argumento a favor de 
que todos condujeran por la izquierda sería tan bue- 
no como el de que todos lo hiciéramos por la de 
recha. Algunos afirman a veces que, por lo tanto, la 
solución racional debe consistir en un equilibrio 
mixto en el que todos decidan si conducir por la iz- 
quierda o por la derecha de forma aleatoria, pero 
¡esta propuesta raramente consigue mucho apoyo! 

Para solucionar el Juego de la Conducción, nece- 
sitamos una convención comúnmente aceptada so- 
bre si deberíamos conducir por la izquierda o por la 
derecha. El hecho de que una convención como ésta 
pueda ser completamente arbitraria se refleja en el 
hecho de que algunos países han adoptado la con- 
vención de conducir por la izquierda, y otros la de 
conducir por la derecha. 


Puntos focales 


En ocasiones las sociedades eligen convenciones de 
manera deliberada, como cuando en Suecia se pasó 
de conducir por la izquierda a conducir por la dere- 
cha en las primeras horas del 1 de septiembre de 
1967. Sin embargo, quizás podría considerarse el 
caso de Suecia en esta ocasión como una versión 
para múltiples jugadores de la Guerra de Sexos, con 
algunos jugadores a favor del equilibrio tradicional 
y otros a favor del equilibrio empleado en el resto de 
la Europa continental. Por sí misma, la racionalidad 
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no puede solucionar estas diferencias sobre cómo 
solucionar los problemas de selección de un equili- 
brio, pero en Suecia la convención consiste en que 
hay que seguir las directrices de su gobierno demo- 
cráticamente electo. Por otra parte, sólo hace falta 


observar el caos que, a pesar de las señales, existe en 


el tráfico en Nápoles para darse cuenta de que las di- 
rectrices de un gobierno elegido democráticamente 
no bastan para garantizar que se cumplirá una con- 
vención. 


Tom Schelling 


¿Qué pasa cuando no se hace evidente una conven- 
ción? Tom Schelling llevó a cabo una serie de experi- 
mentos en los años cincuenta que muestran que no 
somos tan incorregibles como podría pensarse a pri- 
mera vista. Según él, las convenciones que la gente 
inventa cuando le hacen preguntas como las si- 
guientes constituyen puntos focales. La mayoría de 
personas se sorprende tanto por su éxito a la hora 
de localizar puntos focales como por la naturaleza 
arbitraria de las pistas contextuales a las que ellos 
mismos acaban apelando. Una lección importante 
se encuentra en que el contexto en el que aparecen 
los juegos (el modo en que se formula un juego) 
puede marcar la diferencia en el modo de jugarlo en 
la vida real. 
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Dos jugadores eligen independientemente car. 

o cruz. No ganan nada a menos que ambo 

digan lo mismo, en cuyo caso cada uno gan. 
100 dólares. ¿Qué dirías? 


. Vas a reunirte con alguien en Nueva York ma 


ñana, pero no has acordado nada sobre cuándo 
y dónde va a tener lugar el encuentro. ¿Dónd: 
irás? ¿A qué hora? 


. Alice, Bob y Carol deben escribir cada uno 


por separado las letras A, B y C en un order 
determinado. No obtendrán nada a menos 
que elijan el mismo orden, en cuyo caso el ju- 
gador cuya inicial sea la primera obtiene 300 
dólares, el jugador cuya inicial es la segunda 
obtiene 200 dólares y el jugador con la tercera 
inicial obtiene 100 dólares. ¿Qué harías si fue- 
ras Carol? 


. Alice y Bob reciben dos cartas cada uno. Una 


carta está en blanco y la otra marcada con una 
cruz. Un jugador puede marcar una cruz en la 
primera carta o borrar la cruz en la segunda. 
Nadie gana nada a menos que entre las dos 
cartas que se entregan sumen una, y solamente 
una, cruz. El jugador que entrega la carta con 
la cruz gana 200 dólares y el jugador que entre- 
ga la carta en blanco gana 100 dólares. ¿Que 
harías si te tocara la carta en blanco? 

Un filántropo dona 100 dólares a Alice y Bob, 
siempre que se pongan de acuerdo en la forma 
de repartirlos. Se pide a cada jugador por sepa- 
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rado que solicite una fracción del total. Si las 
fracciones suman más de 100 dólares, nadie 
consigue nada. En el caso contrario, cada juga- 
dor recibe la cantidad que solicitó. ¿Cuánto so- 
licitarías? 

O. Alice pierde 100 dólares y Bob los encuentra. 
Bob es demasiado honesto para gastar el dine- 
ro, pero no está dispuesto a devolverlo a menos 
que reciba una recompensa adecuada. ¿Qué 
recompensa le ofrecerías a Bob si fueras Alice? 
¿Qué recompensa le ofrecerías si Bob ya hubie- 
ra rechazado 20 dólares? ¿Qué recompensa le 
ofrecerías si Alice y Bob hubieran visto juntos 
un programa de televisión la noche anterior en 
el cual un gurú anunciaba que el reparto justo 
en esas circunstancias consiste en que Bob ob- 
tenga una recompensa de un tercio de la canti- 
dad total? 


En la primera pregunta, la mayoría de la gente 
dice cara, porque lo convencional es decir cara an- 
tes que cruz cuando ambas se mencionan. 

Lo bien que lo hagan los jugadores en la segunda 
pregunta depende de lo familiarizados que estén 
con Nueva York. Schelling se lo preguntó a gente de 
la cercana Nueva Inglaterra, que se mostró muy fa- 
vorable a encontrarse en la estación Grand Central 
a mediodía. 

En la tercera pregunta, Carol suele reconocer que 
cl orden alfabético es tan focal que tiene que decir 
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ABC, aunque entonces recibirá los pagos más bay. 
de los tres jugadores. 

En la cuarta pregunta, el statu quo es focal y, pu 
lo tanto, la mayoría de gente elegiría no hacer nad. 

En la quinta pregunta, un reparto al cincuen: 
por ciento es casi universal. 

La sexta pregunta es más complicada; normal 
mente la gente consigue coordinarse con eficaci. 
sólo tras saber del gurú, en cuyo caso casi siempr. 
siguen su consejo. 


¿Cuánto es convencional? 


La vida diaria consiste en jugar multitud de Juegos 
de coordinación con los que nos rodean. Cuando los 
jóvenes aprenden cómo jugar a estos juegos de coor- 
dinación emulando a los jugadores exitosos de su 
entorno, normalmente no se dan cuenta en absoluto 
de que están llevando a cabo un juego. Aprenden 
cualquier convención que sea corriente en su socie- 
dad sin apreciar que la convención no sobreviviría a 
largo plazo a menos que coordinara el comporta- 
miento en un equilibrio. Cuando la propia conven- 
ción existe desde hace tanto que sus orígenes se 
pierden en la noche de los tiempos, incluso puede 
resultar convencional negar que la convención sea 
convencional, Entonces resulta imposible reconocer 
que otras sociedades pueden estar jugando esencial- 
mente al mismo juego que nosotros, pero que su 
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distinta historia social ha llevado a un equilibrio dis- 
tinto del juego que se ha convertido en focal. 

David Hume fue el primer filósofo en afirmar alto 
y claro que muchas de nuestras normas de conducta 
Bocial no gozan de fundamentos más sólidos que la 
convención que empleamos para seleccionar un 
quilibrio en el Juego de la Conducción. En su Tra- 
ado de 1739, explica el famoso argumento: 


Dos hombres que reman en un bote lo hacen por acuer- 
Bo o convención, aunque nunca se han prometido nada el 
o al otro. Tampoco la regla referente a la estabilidad de 
propiedades deriva en menor medida de las conven- 
dones humanas, surgiendo gradualmente y ganando 
erza en lenta progresión... De un modo similar se esta- 
ecen los lenguajes gradualmente por las convenciones 
MBumanas, sin promesa alguna. De un modo similar se 
onvierten el oro y la plata en medidas comunes de inter- 
ambio y se estiman pago suficiente por lo que tiene cien 
ces su valor. 


La mayoría de la gente no tiene problemas para 
Aceptar la naturaleza convencional de los lenguajes o 
el dinero, pero establece una frontera cuando los fi- 
lósofos como Hume sugieren que pasa lo mismo 
con temas sensibles como la ética o la religión. A ve- 
ces su oposición al relativismo moral o a la biología 
evolutiva es tan fuerte que sienten la necesidad de 
deshacerse también de la teoría de juegos. Sin em- 
bargo, pienses lo que pienses de las frutas podridas 
de Hume, la teoría de juegos no forma parte de ellas. 
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FIGURA 16. David Hume. 


La teoría de juegos jamás puede suponer una ame- 
naza para un sistema religioso o ético coherente por- 
que no tiene más contenido sustantivo que la arit- 
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mética o la lógica. Solamente establece que algunas 
proposiciones no son coherentes con otras proposi- 
ciones. Como la aritmética o la lógica, puede por 
consiguiente utilizarse a ambos lados del argumento. 
Muchos teóricos de los juegos son profundamen- 
te religiosos, como Bob Aumann, que compartió un 
Premio Nobel con Tom Schelling en 2006. Steve 
Brams incluso ha escrito un libro en el que usa la 
teoría de juegos para sustentar argumentos teológi- 
cos. En cuanto a mí, soy escéptico, pero mi justicia 
natural! acepta que algunos principios de justicia 
son universales en la especie humana. En resumen, 
los únicos que deben temer el uso de la teoría de jue- 
gos son aquellos cuyas creencias sean incoherentes. 


Malas convenciones 


El equilibrio mixto en el Juego de la Conducción no 
es eficiente en absoluto, ya que los jugadores que lo 
realicen acabarán la mitad de las veces parados uno 
enfrente del otro. Pero a pesar de ello sigue siendo 
un equilibrio y por tanto es susceptible de convertir- 
se en convención. Yo solía decir que ésta es una con- 
vención que en realidad no ha surgido en ningún si- 
tio del mundo, hasta que me corrigieron unos turcos 
que observaron que obviamente nunca había visita- 


| Juego de palabras a cuenta de uno de sus libros, Natural Justi- 
ve Binmore, 2005). (N. del T.) 
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do Turquía. Pero ahora ya lo he hecho y ya sé a « 
se referían. 

El Solitario de Schelling es un modelo básico «; 
pretende mostrar cómo la evolución cultural pue: 
conducir fácilmente a convenciones socialmente i 
deseables sin necesidad de un genio malvado qi 
desde las sombras planee el desmoronamiento de | 
sociedad. Se juega en un tablero de Ajedrez con t 
chas blancas y negras; cada ficha representa el pri 
pietario de una casa; el escaque que ocupa la fich 
representa su casa, y los escaques que lo rodea: 
(hasta ocho) representan su vecindario. De mod: 
que una ficha sobre uno de estos escaques represen 
ta un vecindario. 


Cada ficha es sensible al color de los vecinos. La: 


blancas prefieren que la mitad o más de sus vecina- 
sean blancas; las negras desearían que un tercio © 


más de sus vecinas fueran negras. El jugador desa 
rrolla el proceso evolutivo trasladando fichas des 
contentas a escaques en los que están contentas, has - 
ta que llega un momento en que nadie que quiera 
moverse tiene adónde ir. Schelling recomienda em- 
pezar con fichas negras en todos los escaques negros 
del tablero y blancas en todos los escaques blancos; 
se quitan algunas fichas aleatoriamente y a conti- 
nuación empieza el proceso. En la Figura 17 se qui- 
taron 12 fichas. 

Las dos configuraciones que muestra la Figura 17 
son equilibrios resultantes del proceso. Se diferen- 
cian en que existe una parte de aleatoriedad en la 
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houra 17. Solitario de Schelling. 


'onfiguración inicial y en la elección por parte del 
jugador de qué ficha descontenta mover. Pero el 
equilibrio que emerge tiene casi siempre las fichas 
blancas y las negras ocupando vecindarios segrega- 
dos. Vale la pena jugar al Solitario de Schelling unas 
cuantas veces para hacerse una idea de cuán inexo- 
rable puede ser el proceso de separación. En el mo- 
delo, todo el mundo se contentaría con vivir en un 
vecindario mixto, pero acaban con una convención 
que les hace vivir segregados. 


Dilemas sociales 


El Solitario de Schelling muestra lo fácil que puede 
ser que se establezca una convención que no le gusta 
a nadie. De acuerdo con el sociólogo Vilfredo Pare- 
to, los economistas dicen que los resultados son ine- 
licientes cuando hay otros resultados que todo el 


104 LA TEORIA DE JUEGOS. UNA BREVE INTRODUCCION 
mundo prefiere. Pero si nos damos cuenta de que 
e deL 

cionales por no 
cambiar a una eficiente? 
l Quizás, el papel más importante de la teoría de 

Juegos sea insistir en que toda reforma requiere la 
coordinación de los comportamientos en un equili- 
brio si tiene que sobrevivir a largo plazo. Si no existe 
un equilibrio satisfactorio por el que cambiar, como 
en el Solitario de Schelling, inventar un dueto tipo 
de racionalidad que de algún modo oculte las inco- 
herencias del comportamiento individual que im- 
plica un juego fuera del equilibrio sólo puede em- 
peorar las cosas. No hay más que observar la larga 
nómina de utopías fallidas para comprobar por qué 

Karl Marx es uno de los mayores culpables. Chan 
do consideraba el capital y el trabajo como jugado- 
res monolíticos de un poderoso Juego, no fue capaz 
de darse cuenta de que la cohesión de la coalición 
depende de hasta qué punto tiene éxito a la hora de 
satisfacer las aspiraciones de los individuos que los 
conforman. Lo mismo puede decirse de una socie- 
dad entera que es tratada como si fuera un solo indi- 
viduo con Mayúsculas. Ello no equivale a negar que 
la solidaridad grupal a veces pueda triunfar tempo- 
ralmente sobre los incentivos individuales, incluso 
sin que los esquiroles sean castigados por los cama- 
radas a los que traicionan. Tampoco equivale a ne- 
gar que podríamos decir que todos estaríamos me- 

Jor si nos identificáramos más a menudo con alguna 
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concepción del bien común. Un comportamiento 
tal es altruista o incluso propio de un santo, pero nos 
estamos engañando si insistimos en que un compor- 
tamiento más egoísta es, de algún modo, irracional. 

Como el malhumorado filósofo Thomas Hobbes 
explicó hace mucho tiempo: 


Las abejas y las hormigas viven amigablemente las unas 
con las otras... y, por lo tanto, algunos hombres pueden 
quizás querer saber por qué la humanidad no puede ha- 
cer lo mismo. Ante lo cual contesto... entre los animales, 
el bien común no difiere del privado. 


En términos de teoría de juegos, Hobbes afirma 
que los juegos que realizan los insectos sociales en- 
tre sí son juegos de coordinación pura, pero supon- 
go que la mayoría de las personas estarían de acuer- 
do conmigo en que raramente pasa lo mismo entre 
los seres humanos. 

Los errores que estoy señalando aquí son típicos 
de los intelectuales de izquierda, pero los intelectua- 
les de derechas no deben congratularse; con fre- 
cuencia incurren en el error complementario de pa- 
sar por alto la posibilidad de que existan equilibrios 
más eficientes que el equilibrio actual. 

La contribución que la teoría de juegos puede ha- 
cer a estos debates consiste en un marco en el que 
discutir de un modo realista qué es posible o no para 
una sociedad. ¿Qué equilibrios son posibles en el 
juego en el que estamos? ¿Hay un equilibrio que nos 
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satisfaga más a todos que el equilibrio que jugamo 
actualmente? Si no nos gusta ninguno de los equili 


brios posibles, ¿podemos cambiar de algún modo la- 


reglas del juego o las preferencias de los jugadores? 


¿Suponer que todo el mundo se comportará así? 


Los psicólogos sociales dicen que una situación en l: 
que un resultado eficiente entra en contradicción 
con los incentivos de los miembros individuales de 
un grupo es un dilema social. El Dilema del Prisio 
nero constituye el ejemplo arquetípico. 

A menudo puedes distinguir que estás en un dile 
ma social por el hecho de que tu madre dejaría clar. 
su desaprobación de cualquier inclinación agresiv. 
por tu parte diciendo «imagínate que todo el mun 
do se comportara así». Immanuel Kant es conside 
rado con frecuencia el mayor filósofo de todos lo: 
tiempos, pero él también pensó que no podía ser ra 
cional hacer algo malo porque todo el mundo lo hi 
ciera. Como afirma el famoso imperativo categóri 
co: «Actúa siempre bajo la máxima que te gustar: 
que se convirtiera en una ley universal». 

Por ejemplo, cuando en el aeropuerto esperamo- 
el equipaje frente a la cinta que nos trae las maleta: 
sería mejor para todos que nos mantuviéramos se 
parados de la cinta para poder ver salir nuestras bol 
sas. Pero si todos los demás lo hicieran, a cada ind: 
viduo le compensaría adelantarse un poco, así qu 


t CONVENCIONES 107 


acabamos todos estirando el cuello para poder ver 
sobre un muro de espaldas. 

De un modo similar, también saldríamos ganan- 
do si bajáramos el aire acondicionado cuando hay 
peligro de apagón, o si no usáramos nuestros asper- 
sores en caso de sequía. Lo mismo se aplica cuando 
la gente se pone de pie en un partido de fútbol o 
cuando hacen sus gestiones a cámara lenta habien- 
do una larga cola de personas detrás. 

Cuando un gran número de individuos anóni- 
os son jugadores de estos dilemas sociales, Kant y 
madre tienen razón al predecir que las cosas van a 
mal si todos responden a sus incentivos individua- 
s. Pero exhortar a la gente a comportarse mejor en 
ichas situaciones raramente resulta eficaz. ¿Por qué 
ndrías que salir perdiendo por hacerle caso a tu 
adre mientras el resto de personas ignoran a las 


yas? 


Tragedia de los Comunes 


s dilemas sociales diarios antes descritos resultan 
ritantes, pero algunos dilemas sociales representan 
vida o la muerte para quienes deben participar en 
ellos. Un modelo básico ha sido denominado por los 
politologos la Tragedia de los Comunes. 

Un centenar de familias tienen cabras que pastan 
en unas tierras comunales. La producción total de 
leche se maximiza con 1.000 cabras en total. ¿Cuán- 
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tas cabras tendría que tener cada familia para maxi- 
mizar su propia producción de leche? 

A primera vista, la respuesta parece ser diez, pero 
para cada familia no es un equilibrio tener diez ca- 
bras. Si todas las demás familias tienen diez cabras, 
la estrategia Óptima de tu familia no consiste en ha- 
cer lo mismo. Saldrías ganando si tuvieras una cabra 
más pastando, porque tu familia obtendría todos los 
beneficios de criar una cabra más mientras que sus 
costes en términos de una menor hierba para que 
coman las otras cabras se compartirían con toda la 
comunidad. Por consiguiente, las familias añadirían 
cabras adicionales a su rebaño hasta que las tierras 
comunales se redujeran a un desierto. Pero este re- 
sultado es verdaderamente ineficiente. 

La Tragedia de los Comunes capta la lógica de 
todo un espectro de desastres medioambientales 
que hemos causado nosotros mismos: el desierto del 
Sáhara se expande imparablemente hacia el sur, en 
parte porque los pueblos ganaderos que viven en sus 
límites explotan los prados restantes más allá de lo 
recomendable; emitimos a la atmósfera dióxido de 
carbono sin pensar en el futuro; envenenamos nues- 
tros ríos; abarrotamos las carreteras con coches; ta- 
lamos las selvas; hemos saqueado los recursos pes- 
queros hasta que algunas poblaciones de peces han 
alcanzado un nivel del que nunca van a recuperarse. 

Los teóricos de los juegos reciben muchos palos 
por negar que el comportamiento individual que 
conduce a estos desastres sea irracional. Nuestros 
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detractores preguntan cómo puede ser posible que 
sea racional que una sociedad diseñe su propia rul- 
na. ¿Es que no nos damos cuenta de que todo el 
mundo estaría mejor si todos utilizáramos en me- 
nor proporción los recursos comunes? El error de 
este razonamiento es elemental. Un jugador del jue- 
go humano no es una entidad abstracta llamada 
«todo el mundo». Somos todos individuos separa- 
dos, cada uno con sus propios objetivos y propósi- 
tos. Aun cuando nuestra capacidad para el amor nos 
lleva a hacer sacrificios por otras personas, cada uno 
lo hace a su manera y por sus propias razones. Si fin- 
gimos lo contrario, no hay esperanza de lidiar algu- 
na vez con la Tragedia de los Comunes. 


El Juego de la Caza del Ciervo 


Jean-Jacques Rousseau, el profeta de la Revolución 
Francesa, aceptaba que los juegos políticos raramen- 
te son juegos de coordinación pura. Su solución 
consistía en convertirlos en juegos de coordinación 
pura modificando nuestras preferencias: «Si pudie- 
ras ver cumplida la voluntad general, conduce todas 
las voluntades particulares a la conformidad con 
ella». 

Los teóricos de los juegos pasan por alto lo poco 
práctico que resulta este programa radical y, en su 
lugar, se centran en su parábola de la Caza del Cier- 
vo. Alice y Bob se ponen de acuerdo en cooperar en 
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la caza de un ciervo, pero cuando se separan pare 


poner en práctica su plan, cada uno puede verse ten 
tado a abandonar la empresa conjunta por la pers 
pectiva de cazar una liebre por sí solo. | 
Sólo son necesarios ligeros cambios en la versió; 
«dar o tomar» del Dilema del Prisionero de la Figu 
ra 7 para obtener el Juego de la Caza del Ciervo de la 
Figura 18, pero son suficientes para que ambos con- 
a la estrategia paloma en un equilibrio de 
ash. 


Por lo tanto, el Juego de la Caza del Ciervo no pa- 


rece ser un juego de los que crean un dilema social 


S1 nos encontramos situados en el equilibrio de 


A Bob 


siempre 


paloma halcón dd 


EN 
y d 
/ 0 


siempre . 

saloa Alice 
03 i 
siempre siempre 
paloma halcón 


FIGURA 18. El Juego de la Caza del Ciervo. El diagrama de la de- 
recha muestra que la cuenca de atracción del equilibrio de Nash 
(paloma, paloma) es mucho menor que la cuenca de atracción 
del equilibrio de Nash (halcón, halcón). La cuenca de atrac- 
ción del equilibrio de Nash mixto en el cual paloma se elige dos 
tercios de las veces es solamente la línea de puntos. di 
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Nash ineficiente en el que tanto Alice como Bob jue- 
gan halcón, podemos cambiar al equilibrio de Nash 
en el que ambos juegan paloma. No obstante, los pa- 
gos del Juego de la Caza del Ciervo han sido elegidos 
para hacer que la realización de dicho cambio sea di- 
lícil de conseguir. 

La cuenca de atracción del equilibrio ineficiente 


| es grande, y la del equilibrio eficiente es pequeña. 


Por eso es difícil que la evolución nos aleje de la 
cuenca de atracción del equilibrio ineficiente y nos 
introduzca en la cuenca de atracción del equilibrio 
eficiente. Es cierto que no somos animales que ten- 
gan que esperar a las lentas fuerzas de la evolución 
para establecer una nueva convención; podemos ha- 
blar los unos con los otros y acordar un cambio en 


| nuestra forma de hacer las cosas. Pero ¿podemos 


confiar los unos en los otros para honrar el acuerdo 
al que podamos llegar? 

Algunos expertos en relaciones internacionales 
emplean el Juego de la Caza del Ciervo bajo el nom- 
bre de Dilema de la Seguridad o Juego del Seguro, 
para llamar la atención sobre los problemas que 
pueden surgir cuando los jugadores son racionales. 

Supongamos que la convención actual consiste en 
jugar halcón, pero Alice intenta persuadir a Bob de 
que planea optar por paloma en el futuro y que, por 
lo tanto, él debería seguir su ejemplo. ¿Le convence- 
rá? Los teóricos de los juegos creen que no. La razón 
es que independientemente de lo que piense jugar 
Alice en realidad, está interesada en persuadir a Bob 
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de que juegue paloma. Si tiene éxito, conseguirá 5 en 
lugar de 0 si piensa jugar paloma y 4 en lugar de 2 si 
piensa jugar halcón. Por lo tanto, la racionalidad por 
sí sola no permite a Bob deducir nada sobre el plan 
de acción de Alice, por lo que ella dice, ¡porque va a 
decir lo mismo independientemente de lo que pla- 
nee en realidad! Realmente, Alice puede pensar que 
es poco probable persuadir a Bob de no jugar halcón 
y, por lo tanto, tener pensado jugar halcón ella mis- 


ma, pero aun así intentar persuadirlo de jugar pa- 
loma. 


¿Confianza? 


Esta maquiavélica historia muestra que atribuir ra- 
cionalidad a los jugadores no basta para resolver el 
problema de la selección de equilibrios, ni siquiera 
en un caso aparentemente transparente como es el 
del Juego de la Caza del Ciervo. La respuesta están- 
dar consiste en preguntar por qué los teóricos de los 
Juegos insisten en que es racional para los indivi- 
duos confiar los unos en los otros. ¿No estarían tan- 
to Alice como Bob mejor si ambos tuvieran más fe 
en la honestidad del otro? 

Nadie niega que Alice y Bob estarían mejor si con- 
fiaran el uno en el otro, ni tampoco afirman los teó- 
ricos de los juegos que la confianza sea irracional. 
Solamente dicen que no es racional confiar en las 
personas sin una buena razón: que no se puede con- 


4. CONVENCIONES 113 


fiar en la confianza. Por ejemplo, ningún napolitano 
confiará en que los conductores de su ciudad empe- 
zarán a respetar las señales de tráfico sólo porque al- 
guna autoridad les diga que deberían hacerlo. 

Así que, ¿cómo podremos conseguir desplazarnos 
de un equilibrio a otro? La caída del imperio soviéti- 
co nos proporciona un caso magnífico. Algunos paí- 
ses de Europa oriental siguieron con éxito el ejemplo 
de Suecia en el Juego de la Conducción al cam- 
biar de una economía planificada a una de merca- 
do más o menos de la noche a la mañana; de este 
modo minimizaron las posibilidades de que los pro- 
blemas acabaran fuera de control, como en la Rusia 
de Gorbachov, mientras el sistema estaba desequili- 
brado durante el interregno. 

No obstante, sería igual de erróneo deducir del 
Juego de la Caza del Ciervo que las transiciones 
graduales entre convenciones nunca son posibles, 
como lo sería deducir del Dilema del Prisionero que 
lo mismo pasa con la cooperación racional. Ningu- 
no de los juegos es adecuado como modelo de cómo 
funcionan sociedades enteras. No son más que mo- 
delos básicos diseñados para formular un argumen- 
to concreto. 


5. Reciprocidad 


Si queremos entender a toda una sociedad, no pode- 
mos pasar por alto el papel de la reciprocidad, que ha 
sido identificada por varios filósofos, desde Confu- 
cio hasta Hume, como el fundamento de la sociabili- 
dad humana. Si tuvieran razón, todos nosotros esta- 
ramos representando un determinado papel que 
nos Permite mantener una compleja red de relacio- 
nes recíprocas con todos aquellos que nos rodean. 
Sin embargo, la comprensión que nosotros mismos 
tenemos acerca de cómo funciona el sistema es tan 
mala como la física que usamos cuando montamos 
en bicicleta. 

La teoría de juegos da algunas pistas sobre los en- 
tresijos de estos entendimientos que se autorregu- 
lan. ¿Cómo funcionan, ¿por qué perduran?, ¿cuánta 
Cooperación pueden sostener? 
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Juegos repetidos 


En un juego de una sola jugada, Alice no puede pro- 
meterle a Bob que le rascará la espalda mañana si él 
le rasca la espalda a ella hoy, porque hemos adopta- 
do el supuesto implícito de que no se encontrarán 
nunca más. El sistema más simple en el que puede 
surgir la reciprocidad requiere que los mismos juga- 
dores participen en el mismo juego una y otra vez. 


La repetición con un horizonte fijo 


El Dilema del Prisionero ejemplifica el hecho de que 
la cooperación no necesariamente tiene que resultar 
racional. ¿Desaparece esta desagradable conclusión 
si Alice y Bob juegan repetidamente? Si de todos es 
sabido que Alice y Bob van a jugar al Dilema del Pri- 
sionero cada día durante la próxima semana, la re- 
troinducción dice que la respuesta es no. Se despre- 
cia a los políticos como casos perdidos cuando están 
a punto de acabar su último mandato en gran parte 
por la misma razón. 

El sábado, el último día de la semana, Alice y Bob 
estarán jugando al Dilema del Prisionero normal, en 
el cual lo racional es elegir la estrategia halcón. El 
viernes, por lo tanto, sabrán que nada de lo que ha- 
gan ese día puede afectar a lo que hagan mañana. Así 
que jugarán halcón el viernes. Aplicando la retroin- 
ducción a lo largo de los diferentes días de la sema- 
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na, obtenemos el resultado de que los jugadores 
siempre jugarán halcón. También hay equilibrios de 
Nash que no son de perfección en el subjuego, pero 
en todos los casos requieren que en el camino de 
equilibrio se juegue halcón. 


Repetición indefinida 


¿Debe concluirse que la cooperación racional es im- 
posible aunque el Dilema del Prisionero se repita? 
Sería una conclusión precipitada, porque no resulta 
realista suponer que Alice y Bob están seguros de 
que nunca volverán a interactuar después del próxi- 
mo sábado, En la vida real, las relaciones casi siem- 
pre tienen una duración indefinida. Así que, ¿qué 
pasa en un Dilema del Prisionero repetido en el que 
no se sabe que Alice y Bob no volverán a encontrar- 
se? La respuesta es que la cooperación racional aho- 
ra sí es posible. 

En el modelo básico más simple, Alice y Bob 
siempre creen que existe una cierta probabilidad po- 
sitiva de que vuelvan a jugar al Dilema del Prisione- 
ro como mínimo una vez más, independientemente 
de cuántas veces hayan jugado en el pasado. Si la 
probabilidad es lo suficientemente alta y los jugado- 
res valoran lo suficiente sus pagos futuros, el juego 
repetido tendrá muchos equilibrios de Nash. En al- 


gunos de ellos, siempre se elige paloma en el camino 
de equilibrio. 
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Para entenderlo, basta con observar la Estrategia 
del Gatillo, la cual requiere que Alice siempre juegue 
paloma en el Dilema del Prisionero repetido indefi- 
nidamente, a menos que Bob juegue halcón alguna 
vez. Si éste elige halcón, la Estrategia del Gatillo esta- 
blece que, como represalia, la propia Alice debería 
cambiar permanentemente a halcón. Si ambos juga- 
dores emplean la Estrategia del Gatillo, ninguno 
provocará que el otro juegue halcón, de modo que 
ambos emplearán paloma todo el rato. Pero ¿es el 
par (Gatillo, Gatillo) un equilibrio de Nash? 

Todas las mejores respuestas a la Estrategia del 
Gatillo le dicen a Bob que nunca sea el primero en 
jugar halcón. Si lo hace, la mejor serie de pagos que 
podría conseguir en el futuro es 3, 1, 1, 1, ..., que es 
mucho peor que la serie de pagos 2, 2, 2, ..., que es la 
que consigue jugando siempre paloma. Como la Es- 
trategia del Gatillo siempre indica la jugada paloma 
cuando se enfrenta a sí misma, se deduce que la elec- 
ción de la Estrategia del Gatillo por parte de Bob es 
la mejor respuesta a la elección de esta misma estra- 
tegia por parte de Alice. 

Dado que lo mismo se le aplica a Alice, la pareja 
(Gatillo, Gatillo) constituye un equilibrio de Nash 
del Dilema del Prisionero repetido de manera inde- 
finida. 
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Castigo 


Los detractores que equivocadamente creen que la 
teoría de juegos niega que la gente sea altruista por 
naturaleza a veces se ofenden ante la idea de que su- 
puestamente la cooperación no puede funcionar sin 
la amenaza de un castigo. En especial, les desagra- 
da la Estrategia del Gatillo porque castiga cualquier 
desviación del camino de equilibrio con una deter- 
minación implacable. 

Dichos críticos tienen razón en la medida en que 
la amenaza de castigo es intrínseca a la cooperación 
recíproca. Si Alice le cuenta a Bob que le rascaría la 
espalda si él se la rascara a ella, la implicación es que 
ella no se la rascaría si él no fuera a rascársela a ella. 
Normalmente la gente no proporciona un servicio a 
menos que esperen conseguir algo a cambio. Si el 
servicio no se ve recompensado, se acabará. A veces, 
en su lugar se da un «deservicio». No obstante, en la 
vida real los castigos extravagantes como los que 
comporta la Estrategia del Gatillo sólo se pueden 
encontrar en circunstancias extremas. Los castigos 
de cada día normalmente son más proporcionales al 
delito. 

Estamos tan acostumbrados a responder apropia- 
damente a los pequeños castigos provocados por 
nuestras pequeñas transgresiones que raramente 
nos damos cuenta lo más mínimo de ello. Las seña- 
les subliminales de los que nos rodean se traducen 
automáticamente en comportamiento sin control 
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FIGURA 19. Chimpancés limpiándose recíprocamente. 


consciente alguno. Por lo general, no hay que blan- 
dir ningún palo, pues la mayor parte del tiempo se 
retira un poco la zanahoria: nos dan un poco la es- 
palda, los saludos son impercetiblemente más mal- 
humorados, las miradas se dirigen a otra parte... 
Todas estas son advertencias que pasas por alto 
peligrosamente, pues señalan que lo que sigue es 
una exclusión social más grave, a menos que te en- 


miendes. 


¿Altruismo? 


El hecho de que los teóricos de los juegos piensen 
que hay más cooperación recíproca de la que nor- 
malmente se percibe no implica que sostengan que 
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la cooperación es imposible sin reciprocidad. Si | 
gente tiene unas preferencias suficientemente al 

truistas, la cooperación racional deja de ser proble 

mática, incluso en juegos de una sola jugada. Po: 
ejemplo, si Alice y Bob tienen preferencias utilitaris 

tas que les hacen ambicionar la maximización de la 
suma de los pagos de ambos en lugar de sus propios 
pagos individuales, sería un equilibrio de Nash que 
los dos eligieran paloma en el Dilema del Prisionero. 
Nos encontraremos exactamente en esta tesitura 
cuando Alice y Bob sean gemelos idénticos en el Jue- 
go del Halcón y la Paloma del Capítulo 8. 

En qué medida las personas se preocupan las unas 
de las otras es una cuestión empírica de la cual la 
teoría de juegos necesariamente permanece al mar- 
gen. De acuerdo con mi punto de vista personal, 
aunque obviamente el cóctel humano contiene algo 
más que una cantidad ínfima de doctores Jeckyll, no 
me uniría a la utopía que niega la existencia de Mr. 
Hyde. 

Dichas utopías en ocasiones funcionan lo sufi- 
cientemente bien para empezar, pero la dulzura y la 
luz originales se erosionan notoriamente a medida 
que los jugadores responden inconscientemente a 
sus incentivos. Tenemos el ejemplo de un comisio- 
nado de la IRS (Departamento de Tesorería del go- 
bierno de los Estados Unidos) que explicaba por qué 
una encuesta mostró que el porcentaje de ciudada- 
nos que estaban de acuerdo con defraudar impues- 
tos subió del 11 al 17% en los cinco años anteriores: 


y RECIPROCIDAD 121 


«Se trata de un sentido básico de la justicia. Alguien 
ahí fuera cumple con la ley, ve que los demás hacen 
cosas y, con el paso del tiempo, se siente imbécil» 
(Mark Everett en USA Today, 8 de abril de 2004). Así 
que el IRS continúa inspeccionando bajo el supues- 
to de que casi todo el mundo acabará por encontrar 
una excusa para defraudar, a menos que no se ofrez- 
can los incentivos negativos adecuados. 


El Teorema Popular 


¿Pueden estrategias distintas de la del Gatillo soste- 
ner la cooperación racional en un Dilema del Prisio- 
nero repetido indefinidamente? ¿Qué hay de la coo- 
peración racional en otros juegos repetidos? 

Aunque la respuesta de la teoría de juegos a estas 
cuestiones se llama Teorema Popular, no hay ningún 
profesor llamado «Popular». Después de que Nash 
publicara sus ideas sobre el equilibrio, Bob Aumann 
descubrió que en el sector todo el mundo parecía 
conocer las implicaciones para los juegos repetidos 
y, por lo tanto, decidió que sus propios pensamien- 
tos sobre el tema deberían considerarse sabiduría 
popular. 

En 1739, David Hume ya había explicado cómo 
funciona la reciprocidad, pero no creo que Aumann 
supiera nada de sus obras. El biólogo Robert Trivers 
desconocía igualmente las ideas de Aumann cuando 
las reinventó bajo el encabezamiento de altruismo 
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recíproco veinte años después. No fue hasta la publ: 

cación de La evolución de la cooperación, de Axelrod 
en 1984 cuando la idea finalmente dejó de redescu 

brirse, de un modo muy similar a como América 
dejó de ser descubierta después del viaje de Colón en 
1492, 


El Minijuego de la Confianza 


Cuando era un niño, recuerdo que me preguntaba 
por qué los tenderos entregaban las cosas después du 
que estuvieran pagadas. ¿Por qué no se limitaban a 
meterse el dinero en el bolsillo? 

Los economistas lo llaman el problema del com- 
prador cautivo. Mi ejemplo favorito es el mercado 
de diamantes de Amberes. Los comerciantes entre 
gan diamantes de enorme valor para su inspección 
sin ni siquiera pedir un recibo. ¿Por qué no les enga- 
ñan? Encontré la explicación más bonita en el New: 
York Times del 29 de agosto de 1991. Cuando le pre 
guntaron por qué podía confiar en la honestidad del 
dueño de la tienda de antigúedades que vendía sus 
hallazgos a comisión, un tratante nada familiarizado 
con la Estrategia del Gatillo contestó: «Por supuesto 
que confío en él. En este negocio, sabes en quién 
confiar. Los que te traicionan, adiós». 

El Minijuego de la Confianza es un modelo básico 
que hace hincapié en estas cuestiones sobre confian- 
za y reputación. Cuando Alice le presta un servicio a 
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Bob confiando en que Bob la compensará con un 
pago a cambio, su situación es esencialmente la mis- 
ma que en el Juego del Secuestro de la Figura 11. 
Para saber por qué, vamos a rebautizar la estrategia 
de liberar de Alice como servicio, y la estrategia de 
Bob callar como pagar. 

Dado que el Secuestro tiene un solo equilibrio de 
perfección en el subjuego, lo mismo ocurre con el 
Minijuego de la Confianza. Alice no presta el servicio 
porque predice que Bob no pagará. Pero el Teorema 
Popular nos indica que todos los pares de pagos de la 
región del sombreado oscuro de la Figura 20 son 
equilibrios de Nash del juego repetido indefinida- 
mente, incluido el par de pagos (2, 1) que se produce 
cuando Alice siempre presta el servicio y Bob siem- 
pre paga. 

Para entender por qué el Teorema Popular fun- 
ciona, resulta útil preguntarse qué posibilidades se 
abrirían para Alice y Bob si fueran a negociar por 
adelantado cómo jugar al Minijuego de la Confianza 
a una sola ronda. Una posibilidad es que acordaran 
cualquiera de los tres pares de pagos de la Tabla de la 
ligura 11. Estos pares de pagos se encuentran en las 
esquinas del triángulo sombreado de la Figura 20. 
Los puntos restantes del triángulo pueden alcanzar- 
se como compromisos obtenidos por una moneda 
lanzada al aire o por establecer turnos. Por ejemplo, 
el par de pagos resultante del acuerdo entre Alice y 
Bob de que ella siempre prestará el servicio pero él 
sólo pagará la mitad de las veces se encuentra a me- 
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pagos de Alice 
s de Alice 
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Dilema del Prisionero Minijuego de la Confianza 


FIGURA 20. Teorema Popular. Las zonas sombreadas muestran 
las regiones de pagos cooperativos para el Dilema del Prisionero 
y el Minijuego de la Confianza. Se trata de conjuntos de parejas 
de pagos que los jugadores podrían acordar si pudiera imponer 
se el cumplimiento de negociaciones previas al juego. Los trián 
gulos con un sombreado más oscuro muestran las parejas de pa 
gos por juego, cuya existencia —como resultado de equilibrios en 
las versiones repetidas de los dos juegos cuando los jugadores 
son lo suficientemente pacientes- demuestra el Teorema Po 
pular. 


dio camino entre los pares (0, 2) y (2, 1). Dado que 
consiste en todos los posibles compromisos acorda- 
dos por Alice y Bob, el triángulo sombreado se llama 
«región de pagos cooperativos del Minijuego de la 
Confianza». 

El problema de esta historia de negociaciones es 
que no funcionará sin algún tipo de agencia externa 
dispuesta a imponer los contratos que Alice y Bob 
puedan firmar y que sea capaz de hacerlo. Sin una 
agencia externa de este tipo, todo acuerdo entre Ali- 
ce y Bob debe autorregularse. Es decir, debe ser ópti- 
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mo para un jugador respetar el acuerdo en el caso de 
que los demás también lo hagan. De ello se dedu- 
ce que sólo los equilibrios de Nash pueden consti- 
tuir acuerdos viables. Por lo tanto, la única posibili- 
dad para los jugadores racionales de un Minijuego 
de la Confianza a una sola ronda es el resultado inefi- 
ciente en el que Alice no presta el servicio porque 
Bob no va a pagar. Pero ¿qué ocurre si el juego se re- 
pite con una frecuencia indefinida? 

En un juego repetido siempre se mantiene como 
equilibrio de Nash la decisión de jugar el equilibrio 
de Nash del juego a una sola ronda, pero el Teorema 
Popular indica que siempre existen muchos equili- 
brios más. Si los jugadores son lo suficientemente 
pacientes y la probabilidad de que el juego se juegue 
en el futuro al menos una vez más es lo suficiente- 
mente alta, cualquier par de pagos en la región de 
pagos cooperativos está disponible como equilibrio 
de Nash, en el caso de que les proporcione a ambos 
jugadores sus valores minimax o algo más. 

Il argumento básico resulta tan sencillo que no es 
ningún misterio por qué fue descubierto por casi to- 
dos los que reflexionaron sobre los juegos repetidos 
después de que Nash publicara su idea de equilibrio 
en 1951. Tomemos cualquier acuerdo potencial que 
quede dentro de la región de pagos cooperativos. 
Para convertirlo en un resultado de equilibrio de 
Nash solamente es necesario castigar a cualquier ju- 
gador que se desvíe de la estrategia a la que deben ce- 
nirse para implementar el acuerdo. Para los fines del 


126 LA TEORÍA DE JUEGOS. UNA BREVE INTRODUCCION 


argumento, es más fácil emplear el tipo de castigo 
implacable característico de la Estrategia del Gatillo, 
por la cual cualquier desviación se castiga siempre 
del modo más severo del que se disponga. 

¿Cuál es el castigo más severo que Alice puede im- 
ponerle a Bob? Lo peor que puede hacerle es obli- 
garlo a limitarse a sus pagos minimax, porque él res- 
ponderá a los intentos de ella de minimizar sus 
pagos adoptando la respuesta que los maximice 
dada la estrategia de castigo adoptada por ella. En el 
Dilema del Prisionero, el pago minimax para ambos 
jugadores es de 0. En el Minijuego de la Confianza, 
el pago minimax de Alice es 1, y el de Bob, 0. Las 
áreas sombreadas más oscuras muestran, por lo tan- 
to, todos los acuerdos autorregulados de las ver- 
siones de repeticiones indefinidas del Dilema del 
Prisionero y el Minijuego de la Confianza. Ningún 
acuerdo más puede sostenerse como resultado del 
equilibrio de Nash. 


¿Qué puede ir mal? 


Aunque es difícil de demostrar, creo que el Teorema 
Popular ejemplifica la que quizás sea la intuición 
más significativa de la que dispone la filosofía polí- 
tica. Establece que no necesitamos una agencia ex- 
terna que imponga los acuerdos, ya sea real o inven- 
tada, para que la cooperación tenga éxito. En una 
situación repetida, podemos disfrutar todos los be- 
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neficios de la cooperación si ejercemos de policía de 
nosotros mismos. 

No obstante, el Teorema Popular adolece de una 
importante limitación. Asume que toda desviación 
respecto al equilibrio será percibida por el resto de 
los jugadores. Probablemente no se trate de un mal 
supuesto si lo aplicamos a los pequeños grupos de 
cazadores-recolectores en los que empezó a evolu- 
cionar la cultura humana. Como ocurre en los pue- 
blecitos de hoy en día, presumiblemente todos lo sa- 
bían todo sobre los asuntos de los demás. Pero 
ciertamente ello no se sostiene en la vida urbana 
moderna. En el anonimato de una gran ciudad, no 
es posible detectar y castigar a los que se desvían con 
la frecuencia necesaria como para disuadir a los 
transgresores. Hacemos todo lo que podemos con 
cámaras de vigilancia en circuito cerrado, policías, 
auditores, inspectores de hacienda y similares, pero 
nadie se atrevería a afirmar que nuestros esfuerzos 
en este sentido son, ni de lejos, eficaces. 

Me gustaría poder decir que los teóricos de los 
juegos tienen todas las respuestas al problema de la 
supervisión imperfecta, pero éste sigue siendo en 
gran medida terra incognita, a pesar de los esfuerzos 
realizados por mucha gente inteligente. Se trata pro- 
bablemente del área de la teoría de juegos en la que 
de producirse un mayor progreso, éste brindaría 
mayores beneficios sociales. 
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Toma y daca 


La mayoría de científicos sociales piensa que todo h 
que necesitan saber sobre la reciprocidad se resum: 
en la estrategia de Toma y daca para el Dilema dei 
Prisionero repetido indefinidamente. Ésta estableci 
que el jugador debe empezar con paloma, y a parti 
de entonces copiar la respuesta del otro jugador en 
la ronda anterior, sea cual sea. Constituye un equili- 
brio de Nash si tanto Alice como Bob implementan 
Toma y daca del mismo modo, que es un equilibrio 
de Nash que ambos llevan a cabo en la Estrategia dei 
Gatillo, pero Toma y daca no castiga una desviación 
implacablemente. Los pecadores arrepentidos son 
perdonados cuando vuelven al redil jugando paloma 
de nuevo. 

La popularidad del Toma y daca deriva de las 
Olimpiadas organizadas por Bob Axelrod, en las cua: 
les se invitó a científicos sociales para que enviaran 
programas de ordenador con estrategias que se en- 
frentaran entre sí en un Dilema del Prisionero re- 
petido indefinidamente. Después de conocer los 
resultados de una ronda piloto, los participantes 
aportaron programas que implementaban 63 del in- 
finito número de estrategias posibles para el juego. 

La estrategia más exitosa de la competición fue el 
Toma y daca. Así que Axelrod siguió simulando el 
efecto de la evolución trabajando con todas y cada 
una de las 63 estrategias. Para Axelrod, el hecho de 
que el Toma y daca fuera el más numeroso de los 


ES 
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programas supervivientes al final de la simulación 
evolutiva cerró la cuestión, así que procedió a pro- 
poner el Toma y daca como posible paradigma de la 
cooperación humana en todas las situaciones. Al 
describir sus virtudes, explica: 


Lo que explica el robusto éxito del Toma y daca es su 
combinación de ser bondadoso, vengativo, indulgente y 
claro. Su bondad evita que se busquen problemas innece- 
sarios. Su venganza disuade al contrario de persistir en su 
actitud de defección. Su indulgencia ayuda a restaurar la 
cooperación mutua. Y su claridad lo hace inteligible para 
el resto de jugadores, lo que le permite conseguir la coo- 
peración a largo plazo. 


Sin embargo, describir el Toma y daca como la es- 
trategia más exitosa en la simulación de Axelrod 
equivaldría a dorarle la píldora. Seis de las estrategias 
presentadas a las Olimpiadas sobrevivieron al proce- 
so evolutivo, y, por lo tanto, el verdadero ganador fue 
la estrategia mixta en la cual las estrategias supervi- 
vientes se juegan con la frecuencia con la que apare- 
cian cuando el proceso se estabilizaba. La frecuencia 
del Toma y daca en esta mezcla de seis estrategias en 
realidad no era de más de un sexto. Tampoco resulta 
consistente el limitado éxito del Toma y daca alcan- 
zado en la simulación cuando la población inicial de 
estrategias variaba. La despiadada Estrategia del Ga- 
tillo cosecha unos resultados extremadamente bue- 
nos cuando la población inicial de estrategias presen- 
tadas no está sesgada a favor del Toma y daca. 
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Axelrod definió una buena estrategia como aqua 
lla que nunca es la primera en elegir halcón, pero n 
es cierto que, como él sugiere, podamos confiar en | 
evolución para generar un buen comportamiento 
Cuando se permite la entrada de un flujo continu: 
de una pequeña fracción de pringados a los que mu 
rece la pena explotar, las estrategias malvadas obtic 
nen mejores resultados que el Toma y daca. La ma: 
simple de estas estrategias malvadas es lo que po 


dríamos llamar Daca y toma, que empieza Jugando 


nalcón y a partir de entonces cambia de actitud sola 

mente si el oponente jugó halcón la última vez. Dos 
estrategias Daca y toma constituyen un equilibrio de 
Nash en el Dilema del Prisionero repetido indefini 

damente, en el cual se alcanza la cooperación sólo 
después de la primera ronda de juego. 

En cuanto a la claridad, la cooperación sólo re 
quiere que un mutante sea capaz de reconocer una 
copia de sí mismo. 

lodo lo que queda de la lista de Axelrod es el re- 
quisito de que una estrategia exitosa sea vengativa. 
Esta es quizás la afirmación que más daño ha hecho. 
porque sólo se aplica a interacciones por parejas. Por 
ejemplo, se dice que la reciprocidad no puede expli- 
car la evolución de la amistad. Es cierto que las 
alianzas ofensivas-defensivas de los chimpancés no 
pueden explicarse mediante una historia de Toma y 

daca. Si Alice necesita ayuda porque está herida o 
enferma, sus aliados no tienen incentivos para acu- 
dir en su auxilio, porque ahora es poco probable que 
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resulte útil como aliada en el futuro. Cualquier ame- 
naza por su parte de dejar de cooperar será vacua. 
Pero no tiene por qué ser la parte herida la que casti- 
gue al traidor en una interacción entre múltiples 
personas. Otros estarán observando si Bob abando- 
na a Alice a su suerte y castigarán su deslealtad re- 
chazando establecer alianzas con él en el futuro. 
Después de todo, ¿quién quiere aliarse con alguien 
que tiene la reputación de abandonar a sus amigos 
cuando tienen problemas? 

Creo que el entusiasmo por el Toma y daca so- 
brevive por la misma razón por la que la gente solía 
afirmar que es racional cooperar en Dilemas del Pri- 
sionero de una ronda: quieren creer que los seres 
humanos en esencia son buenos. Pero la verdadera 
lección que nos proporcionan las Olimpiadas de 
Axelrod y muchas simulaciones evolutivas que se 
han llevado a cabo con posterioridad es infinita- 
mente más tranquilizadora. 

Aunque los argumentos de Axelrod sobre el Toma 
y daca son pretenciosos, su conclusión de que la evo- 
lución es susceptible de generar un resultado coope- 
rativo parece ser realmente sólida. Por con siguiente, 
no hay que fingir que todos somos doctores Jekyll 
para explicar cómo conseguimos relacionarnos bien 
con los otros gran parte del tiempo. Incluso una so- 
ciedad de señores Hyde puede aprender a coordi- 
narse en un equilibrio eficiente en un juego repetido 
indefinidamente. 
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Fenómenos emergentes 
A menudo se tacha a los modelos de teoría de jues: 


sobre las relaciones sociales de reduccionistas po: 
que no hacen referencia a conceptos como la auto 


ridad, la culpa, la cortesía, el deber, la envidia. i- 


amistad, la culpabilidad, el honor, la integridac 
la justicia, la lealtad, la modestia, la propiedad, el o1 


gullo, la reputación, el estatus, la confianza, la virtuc 


y demás. Se infiere que la teoría de juegos es una dis 
ciplina inhumana que trata a la gente como robot: 


Es verdad que, como todas las ciencias exitosas, |: 
teoría de juegos es reduccionista, pero no por ello lo- 
teóricos de los juegos piensan que conceptos como 


los de «autoridad» o «deber» son irrelevantes para e! 
comportamiento humano. Por el contrario, creemos 
que estos conceptos constituyen fenómenos emer 
gentes que surgen cuando la gente intenta dar senti 
do a los equilibrios en los que ellos mismos se en- 
cuentran interactuando en el juego de la vida. 

Por ejemplo, la explicación popular del equilibrio 
en el que Alice siempre le presta un servicio a Bob y 
Bob siempre paga en el Minijuego de la Confianza es 
que Bob no puede permitirse perder su reputación 
de honesto engañando a Alice, porque en ese caso 
ella rehusaría prestarle más servicios en el futuro. En 
la práctica, Bob a menudo será alguien nuevo, pero el 
mismo equilibrio funciona igual de bien, porque, 
como Alice, nadie estará dispuesto a hacer negocios 
con alguien que tenga reputación de moroso. 
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Lejos de negar estas historias, la teoría de Juegos 
ofrece una explicación pormenorizada de por quéa 
veces funcionan y por qué otras veces no funcio- 
nan. Por ejemplo, nuestros detractores afirman que 


| estamos equivocados sobre el Minijuego de la Con- 


fianza porque la gente sigue pagando, aunque se 
trate de juegos a una sola ronda en los que la repu- 
tación de honestidad es irrelevante. Pero creo que, 
presumiblemente, cada vez más las estaciones de 
servicio te hacen pagar la gasolina por adelantado 
porque han experimentado demasiado a menudo el 
equilibrio de perfección en el subjuego en el Mini- 
juego de la Confianza a una ronda como para que- 
rer seguir jugando. 


Autoridad 


David Hume nos dice que la autoridad de los papas, 
presidentes, reyes, jueces, policías y demás sólo es 
una cuestión de convenciones y costumbres. Alice 
obedece al rey porque es la costumbre; y la costum- 
bre sobrevive porque el rey le ordenará a Bob que 
castigue a Alice si no obedece. Pero ¿por qué cumple 
Bob la orden de castigar a Alice? En resumen, ¿quién 
vigila a los vigilantes? 

La teoría de juegos responde a esta antigua pre- 
gunta demostrando que hay una versión del Teore- 
ma Popular que no solamente se sostiene para de 
equilibrios de Nash, sino también para los equili- 
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brios de perfección en el subjuego. Cuando se esta 
blece uno de estos equilibrios, siempre resulta óptı 


mo castigar todo comportamiento que se desvíe de 


él y nos conduzca a un subjuego ajeno al camine 
de equilibrio. Si te desvías tratando de evadir los cos 
tes de castigar a alguien que se desvía, nos llevarás : 
otro subjuego en el que es óptimo para algún otro 
Jugador castigarte. Si no lo consigue, tendremos un 
subjuego adicional, y así hasta el final. 

Immanuel Kant creía inocentemente que con 
templar estas cadenas de responsabilidad equivale a 
iniciar una regresión infinita, pero el Teorema Popu 
lar muestra que las cadenas de responsabilidad pue 
den cerrarse entre sí. Con sólo un número finito de 
Jugadores, dichas cadenas de responsabilidad se cie 
rran necesariamente de un modo que Kant no tuve 
en cuenta. Alice obedece al rey porque teme que en. 
caso contrario Bob la castigue. Bob cumpliría la or 
den de castigar a Alice porque teme que en caso 
contrario Carol le castigase a él. Carol cumpliría la 
orden de castigar a Bob porque teme que en caso 
contrario Alice la castigaría a ella. 

A primera vista, una espiral como ésta de creen- 
cias que se confirman por sí mismas parece dema 
siado frágil para sostener algo sólido. Es cierto que 
las creencias giran en círculo, pero el Teorema Popu- 
lar muestra que su fragilidad es una ilusión, ya que 
el comportamiento generado por las creencias man- 
tiene en funcionamiento un equilibrio de perfección 
en el subjuego. 


4 RECIPROCIDAD 


Deber 


Los antropólogos nos dicen que las sociedades caza- 
doras-recolectoras puras carecen de estructura de 
autoridad. Los alimentos se recolectan y distribuyen 
bajo el principio de que todos contribuyen según sus 
capacidades y se benefician de acuerdo con sus nece- 
sidades. 

¿Cómo puede sobrevivir un contrato social como 
éste? Si sólo estuviera disponible el mecanismo del 
Toma y daca, ¿por qué compartiría alguien alimen- 
tos con gente carente de poder ajena asu familia? Sin 
embargo, el castigo por no compartir no es necesa- 
riamente administrado por aquel que pasa hambre. 
En grupos modernos de recolectores, se une todo el 
grupo para castigar al transgresor. 

Para entender cómo puede funcionar un sistema 
de este tipo, imaginémonos un modelo de mundo 
en el cual sólo están vivas a la vez una madre y una 
hija en un momento dado. Cada jugador vive du- 
rante dos periodos. El primero es el de su Juventud, 
el segundo el de su vejez. En su juventud, un jugador 
hornea dos hogazas grandes de pan. Entonces da a 
huz una hija e inmediatamente envejece. Los jugado- 
res viejos son demasiado débiles para trabajar y, por 
lo tanto, no producen nada. 

Un equilibrio requiere que cada jugador consuma 
sus dos hogazas de pan en su juventud. En ese caso, 
todos tendrán que aguantar una vejez miserable, 
pero todos estarán haciendo lo óptimo dadas las de- 
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cisiones de los demás. Todos los jugadores prefer. 
rían consumir una hogaza en su juventud y otra « 
su vejez. Pero este resultado «justo» sólo puede a: 
canzarse si todas las hijas les dan una de sus dos ho 
gazas a sus madres, ya que el pan se echa a perder 
no se consume al salir del horno. 


Las madres no pueden vengarse si sus hijas so: 


egoístas, pero, no obstante, el resultado justo pued: 
sostenerse como equilibrio. En este equilibrio just: 
un conformista es un jugador que le da a su madı: 
una hogaza solamente si su madre fue conformist. 
en su juventud. Por consiguiente, los conformist. 
premian a los demás conformistas y castigan alos n: 
conformistas. 

Para entender por qué una hija le da a su mad: 


una hogaza, supongamos que Alice, Beatrice y Caro. 


son madre, hija y nieta. Si Beatrice desatiende a A;. 
ce, se convierte en no conformista. Por lo tanto, €. 
rol castiga a Beatrice para evitar convertirse a su 
en no conformista. Si no, será castigada por su hija. 
así sucesivamente. Si el primer jugador en nacer « 
considerado un conformista, ser conformista 


convierte para todos en un equilibrio de perfeccio- 


en el subjuego. No obstante, el que está herido no : 
nunca la persona que castiga una infracción del co: 
trato social. En realidad, el herido está muerto cua. 
do llega el momento de castigar al infractor. 

En la vida real, se dice que las hijas tienen el del: 
de cuidar a sus indefensas madres. El modelo mu: 
tra cómo dicho deber puede ser honrado en : 
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mundo racional aunque todas las hijas sean egoístas 
de corazón duro. 


El papel de las emociones 


En algún momento, las emociones fueron desesti- 
madas como impulsos sobrantes de nuestra historia 
evolutiva. Las emociones que surgen socialmente y 
que se asocian con el orgullo, la envidia y la ira toda- 
vía se incluyen entre los siete pecados capitales. Pero 
si dichas emociones son tan autodestructivas como 
mantiene la tradición, ¿por qué nos ha dotado de 
ellas la evolución? Comparto el punto de vista hoy 
extendido de que la tradición se equivoca totalmen- 
te al considerar que nuestras reacciones emociona- 
les carecen de un papel útil para los acontecimientos 
sociales. 

Por ejemplo, el escenario prototipo de una expre- 
sión de ira surge cuando Alice trata a Bob injusta- 
ente. Dada su ira ante la injusticia por ella cometi- 
da, es probable que Bob le cause algún daño. Por lo 
anto, Alice se afana en mantener bajo control sus 
stintos codiciosos, no sea que suscite la ira de Bob. 

De este modo, es posible sostener equilibrios efi- 
lentes en juegos repetidos sin que ninguno de los 
gadores sea consciente de que juegan a un jue- 
go repetido. ¿Cómo si no podrían los chimpancés 
sostener un nivel elevado de altruismo recíproco? 
¿Como seríamos capaces los humanos de la misma 
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hazaña si siempre tuviéramos que emplear mu 
hora o más en calcular qué hacer antes de empi 
der una acción? Parte de nuestro pensamiento en 


tas situaciones debe de estar, con seguridad, graba +. 


a fuego, y, quizás, lo que se siente cuando nuestro 
loto automático toma el control es que entramos - 
un estado emocional. 


Venganza 


Supongamos que Bob se arriesga a hacerse daño . 
lanzar un ataque contra Alice después de que ella i 
haya tratado injustamente. El comportamiento d 
Bob podría ser tachado de irracional por unos ob 
servadores que no se dieran cuenta de que no neci 
sariamente está actuando con furia en un Juego d 
una ronda, sino que puede estar sosteniendo su pa! 
te del equilibrio en un juego repetido indefinida 
mente, 

Los experimentos con el Juego del Ultimátun 
proporcionan en la actualidad un punto de vista so 
bre este tipo de confusión. ¿Por qué no aceptan lo: 
sujetos del experimento cualquier cosa que les ofrez- 
can en las versiones a una sola ronda del Juego del 
Ultimátum? Una respuesta común es que se enfadan 
y las rechazan por resentimiento. El análisis de los 
niveles de testosterona en sus esputos parecería con- 


firmar que esta explicación es correcta, por lo visto 
hasta ahora. 
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Pero ¿por qué se enfadan los participantes! Creo 
que lo hacen porque es su respuesta habitual a i 
oferta injusta en situaciones que implican un ulti- 
mátum en la vida real. Este comportamiento sobre- 
vive en situaciones repetidas porque sirve para guar- 
dar un equilibrio. Se activa en juegos de aa 
porque inicialmente los jugadores no perciben E 
diferencias entre el juego de laboratorio y el juego de 
la vida al que están habituados. Pero de ahí no se 
deduce que seamos meros robots controlados por 
nuestras emociones. Normalmente, los sujetos adap- 
tan su comportamiento a los juegos de o 
que juegan en un laboratorio a medida quea e 
ren experiencia. En el Dilema del Prisionero, no 7 
cen falta más que cerca de diez intentos para que e 
90% de los jugadores aprenda que inclinarse por pa- 
loma no tiene sentido en un juego de una sola ron- 
da, no repetido. 


6. Información 


En un juego de información perfecta como el Aje 
drez, los jugadores siempre saben todo lo que ha pa 
sado anteriormente en el juego. Cuando la informa 
ción es imperfecta, debemos conocer lo que saben lo 
jugadores a medida que avanzan por el árbol de dı 
cisión. Von Neumann nos enseñó a hacerlo medianı. 
la simple idea de un conjunto de información. 

La Figura 21 muestra dos formas de expresar u: 
juego de movimiento simultáneo, como el Juego d: 
las Monedas, como un árbol con conjuntos de info: 
mación. No importa qué jugador mueve el primer: 
si el jugador que mueve el segundo no conoce la de 
cisión tomada por el primer jugador, así que pode 
mos hacer que comience tanto Alice como Bol- 
Cuando Alice empieza el juego, incluimos los do 
nodos de decisión de Bob en un conjunto de info: 
mación para indicar que cuando mueve no sabe si s: 
encuentra en el nodo izquierdo o en el derecho. 
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Cruz cara 


Bob 


Alice Bob 
Conjunto de información 


FIGURA 21. Información del Juego de las Monedas. Un jugador 
no puede distinguir entre dos nodos de decisión contenidos en 
el mismo conjunto de información. Los pagos de Alice se en- 
cuentran siempre en la esquina inferior derecha de las cajas. 


Cuantos más conjuntos de información incluya- 
mos en un juego de forma extensiva, menor será su 
forma estratégica. La razón radica en que una estra- 
tegia pura solamente especifica una acción para cada 
uno de los conjuntos de información de los jugado- 
res, no para cada uno de los nodos de decisión que 
contiene. 

Si elimináramos el conjunto de información en la 
versión del Juego de las Monedas en la que Alice jue- 
ga primero, Bob tendría 4 = 2 x 2 estrategias puras, 
cada una de las cuales especifica la elección de una 
de sus dos acciones para cada una de las dos accio- 
nes de Alice. Con el conjunto de información, no 
puede hacer sus acciones contingentes respecto a las 
acciones de Alice, porque no tiene información so- 
bre éstas. Así que sólo dispone de dos estrategias pu- 
ras, una para cada una de sus acciones. 


l4? 


SPEREN DER EGOS UNA BENE IN El 


Póquer 


El arquetipo de juego con información Imperlo > 
es el Póquer. Al contrario que el Ajedrez, pode: 
resolver versiones simples del Póquer expli: 
mente. 

Lo que me convirtió en un teórico de los Jue. 
fue el análisis del Póquer que hizo Von Neumann. ` 
sabía que los buenos jugadores de Póquer se tir... 
muchos faroles, pero simplemente no me creía qu 
pudiera resultar óptimo hacerlos tantas veces con 
afirmaba Von Neumann. ¡Tendría que habérmo-. 
pensado dos veces antes de dudar del maestro! De 
pués de muchos cálculos farragosos, no sólo tus 
que admitir que él tenía razón, sino que me encon 
tré enganchado a la teoría de juegos sin remedio po 
siempre jamás. 

No obstante, te vas a llevar una decepción si espe 
ras hacerte rico jugando una estrategia maximin er 
la mesa de Póquer. Los participantes en el Campeo 
nato Mundial de Póquer de Las Vegas juegan de un 
modo más parecido al que recomienda Von Neu- 
mann que los amateurs como tú y como yo. y los ju- 
gadores legendarios, como el gran Amarillo Slim, 
no triunfaron por jugar de acuerdo con el teorema 
minimax. 

No se trata sólo de que jugar la estrategia maxi- 
min te pueda ofrecer un beneficio medio no mayor 
de cero en un juego justo, sino que sería casi tan en- 
tretenido como mirar cómo se seca una pintura. 


pi 


e INEORMACION 


Por ejemplo, si Alice recl- 
biera cuatro ochos al jugar 
con Bob al póquer sin des- 
cartes, su estrategia maxl- 
min le indicaría que debe 
subir la apuesta cuatro ve- 
ces, pero ¡retirarse si Bob 
sube la suya una vez más! 
Para ganar dinero en una 
mesa de póquer de verdad 
hay que ser mucho más 
emprendedor; debes bus- 
car activamente las debili- 
dades psicológicas de tus 
contrincantes y sacar partido de ellas. No pa 
menos que seas un maestro natural de la an l e 
humana como Amarillo Slim, ¡es probab € v a 
inocentes intentos por explotar las debilidades dl A 
demás acaben con los demás explotando las tuyas: 


FIGURA 22. Full. 


Ir de farol 


No te preocupes si no conoces la a E 

una escalera de color y un full, o las reglas e r A 

en la variedad «Texas Hold'em». El more o 

de Von Neumann se abstrae mas allá de todas estas 
icaciones. 

oo como Bob reciben un DA 

0 y 1. Ambos tienen el objetivo de maximizar suş 
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ganancias medias de dólares bajo el supuesto de 
que todos los números tienen la misma probabili- 
dad de ser entregados a tu oponente, independien- 
temente de lo que tú recibas. De este modo, si Alice 
recibe un 0,667, piensa que tiene aproximadamen.- 
te el doble de posibilidades que Bob de tener la car- 
ta más alta. 

Antes del reparto, cada jugador pone una apuesta 
de 1 dólar en el bote. Después del reparto de cartas, 
hay una ronda para apostar, durante la cual Bob 
puede retirarse. Si se retira, Alice se lleva el bote, in- 
dependientemente de quien tenga la mejor mano. Si 
Bob no se retira, se muestran las cartas y, a continua 
ción, el jugador con la carta más alta gana el bote. Se 
muestran las cartas cuando Bob «ve» la apuesta du 
Alice igualando su contribución total al bote con la 
de ella. 

El modelo de Von Neumann restringe estricta- 
mente las posibilidades de subir la apuesta. Primero. 
Alice puede o pasar (no añade nada al bote) o subir 
la apuesta (añade 1 dólar al bote). Si pasa, Bob debe 
ir. Si Alice sube la apuesta, Bob tiene elección, puede 
retirarse O ir. 

La Figura 23 muestra las estrategias maximin de 
los jugadores en el modelo de Von Neumann. To- 
dos los que juegan al Póquer de andar por casa sa- 
ben que a veces Alice tiene que subir la apuesta con 
manos malas o Bob sabrá que nunca debe ir cuan- 
do ella tiene una buena mano. Los amateurs inten- 
tamos alcanzar un compromiso tirándonos faroles 
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probabilidad 


probabilidad 
de apostar alto 


de apostar alto 


Bob 


Alice 


0 > E 
l carta J Q K carta 


1/10 7/10 


FIGURA 23. Lajugada maximin en el modelo de Póquer de Von 
Neumann. El gráfico de la izquierda muestra el modo en que la 
probabilidad con la que Alice y Bob deberían apostar alto varía 
en función de la mano que tengan. Sólo se muestra una de las 
muchas estrategias óptimas de Bob. El gráfico de la derecha 
muestra que la jugada Óptima de nuestra versión simplificada 
tiene un carácter similar. 


con manos medias, pero la estrategia maximin no 
es tan tímida. Si quieres Jugar al Póquer contra bue- 
nos oponentes y acabar sin pérdidas ni ganancias, 
¡ve de farol mucho y con manos realmente malas! 
Lo bueno de los faroles no es tanto que puedas ga- 
nar con una mano mala como que quieras animar a 
tus oponentes a subir la apuesta con manos medias 
cuando tienes una buena mano. 
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Un modelo todavía más simple 


El modelo siguiente simplifica el Póquer todav. 
más al sustituir las cartas numéricas de Von Net 
mann por una baraja que contiene sólo el rey, la rc: 
na y la J de corazones. No obstante, la Figura 2 
muestra que las estrategias maximin siguen tenien 
do el aspecto de las del modelo de Von Neumann. 

l El movimiento aleatorio que inicia el juego en |. 
Figura 24 representa al que baraja las cartas en sei 
órdenes igual de probables. Alice recibe la carta de 
arriba de la baraja y Bob la segunda. El resto del ár 
bol del juego muestra las reglas de apuesta de Von 
Neumann aplicadas a la nueva baraja de cartas. 

El árbol de decisión tiene un aspecto tan impre 
sionante que probablemente te sorprenderá descu- 
brir que sabes todo lo necesario para resolver el 
Juego. En primer lugar, borra las estrategias domi- 
nadas engrosando las ramas que son obviamente 
mejores que su alternativa. Por ejemplo, Alice ten- 
dría que pasar cuando tiene la reina, porque Bob 
sólo va cuando lo tiene seguro. Por lo tanto, única- 
mente quedan en duda dos decisiones. ¿Alice irá de 
farol cuando tenga una jota? ¿Bob va cuando tiene 
Una reina! 

La Figura 25 muestra todas las estrategias puras 
del juego, pero sólo importa la parte sombreada de 
la forma estratégica, porque las estrategias que co- 
rresponden a la parte sombreada están dominadas. 
La figura también muestra una ampliación de la 
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FIGURA 24. Modelo de Von Neumann. Después de que se ha- 
yan engrosado líneas para mostrar las acciones dominantes, 
sólo quedan los casos en los que Alice tiene la jota y Bob la reina. 


parte sombreada. Podemos calcular los equilibrios 
de Nash mixtos encontrando qué estrategias deben 
emplear Alice y Bob para hacer indiferente a su Opo- 
nente. Resulta que Alice tendría que jugar SPS (subir 
cuando tiene la J) con una probabilidad de 1/3. Bob 
debería jugar HR (ir cuando tiene la reina) con una 


probabilidad de 1/3. 


A 
EN 
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RRR ORRI RIR RII IRR IRI HR 11 


IRR HIR 


FIGURA 25. La tabla de pagos del modelo de Póquer de Vor: 
Neumann. La estrategia SPS de Alice requiere que suba cuand 
tiene el rey, pase cuando tiene la reina y suba cuando tiene la jota 
La estrategia IRR de Bob requiere que vaya cuando tiene el rey, A 


eli l ; i ; 
ed cuando tiene la reina y se retire también cuando tenga |. 
a. 


Tipos 


De acuerdo con el filósofo Hobbes, el hombre se c«: 
racteriza por su fuerza física, sus pasiones, su expe 
riencia y su razón. En la teoría de juegos, la fuerza fì 
sica de Alice se determina por las reglas del juego 
sus pasiones se traducen en sus preferencias y su es 
periencia en sus creencias. Su razón la lleva a con: 
portarse racionalmente. 

Estas cuatro características determinan de qu: 
tipo de Jugador se trata. A menos que alguien diga |: 
contrario, un análisis racional del juego da por su 
puesto que los tipos a los que pertenecen todos lo: 
Jugadores son de todos conocidos. Este supuesto tat: 
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importante a veces se refuerza al afirmarse que la in- 
formación del juego es completa. 

¿Cuándo es razonable asumir que la información 
es completa? Un juego como el Ajedrez no da pro- 
blemas, ¿pero qué hay del Gallina? ¿Es realmente 
probable que Alice conozca el grado de aversión al 
riesgo de Bob con la suficiente precisión como para 
calcular sus pagos? ¿Qué creerá Bob de los pagos de 
ella? ¿Qué creerá Alice que Bob cree de sus pagos? 


John Harsanyi 


Alice no conoce la mano de Bob en el Póquer. Bob 
no sabe lo que Alice piensa de su mano. Alice no 
sabe lo que Bob cree que ella cree sobre la mano de 
él. Y así sucesivamente. Nosotros cerramos esta apa- 
rentemente infinita cadena de creencias sobre las 
creencias asumiendo que el movimiento aleatorio 
que representa el barajar y el reparto de cartas es co- 
nocido por todos. John Harsanyi nos enseñó cómo 
emplear trucos similares cuando la información es 
incompleta. 

Harsanyi vivió una vida muy agitada para ser aca- 
démico. Como judío en Hungría, escapó del de- 
sastre por los pelos no una vez, sino dos. Habiendo 
eludido los campos de la muerte nazis, entró ilegal- 
mente en Austria junto a su mujer para escapar de la 
persecución de los comunistas que sucedieron a 
aquéllos. Una vez en Occidente, tuvo que construir 
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su carrera de nuevo desde cero, trabajando en una 
fábrica en Australia para empezar. 

Como muchos intelectos verdaderamente origi- 
nales, su talento inicialmente no fue reconocido. A 
los economistas les llevó veinticinco años valorar la 
ingenuidad de su idea para lidiar con la información 
incompleta, pero todavía estaba vivo cuando le otor- 
garon el Premio Nobel en 1994, junto a John Nash y 
Reinhard Selten, por su trabajo sobre la información 
incompleta en los juegos. Queda por ver si su tam- 
bién importante trabajo sobre el utilitarismo gozará 


alguna vez del reconocimiento que merece ahora 
que está muerto. 


Información incompleta 


Aunque los economistas hablan de juegos de infor- 
mación incompleta, no existe tal cosa. La teoría de 
Harsanyi muestra cómo una situación con informa- 
ción completa a veces puede transformarse en un 
juego de información imperfecta, al que entonces 
analizamos mediante el concepto de equilibrio de 
Nash. 

Cuando la información es incompleta, el proble- 
ma suele consistir en que puede haber diferentes 
tipos de jugadores, con preferencias y creencias dife- 
rentes. Harsanyi propuso gestionar este tipo de si- 
tuación como si a cada jugador le asignaran un tipo 
al igual que en el Póquer. | 


| 
| 


b. INFORMACIÓN 151 


Las características de este movimiento de asigna- 
ción de tipos deben ser conocidas por todos para 
que el enfoque de Harsanyi funcione. Los economis- 
tas no parecen preocupados por este requisito, pero 
mi punto de vista es que el método sólo es genuina- 
mente viable cuando se dispone de toda la informa- 
ción, la cual debe ponerse en común en una base de 
datos conocida por todos y a la que todos puedan 
acceder. 


Ignorancia de una parte en el Gallina 


A menudo los hombres de negocios de mediana 
edad juegan al Gallina cuando conducen coches que 
avanzan en sentidos opuestos en calles estrechas. En 
la versión con una parte ignorada que muestra la Fi- 
gura 26, todo lo referente al juego es conocido por 
todo el mundo, excepto el mayor pago de Bob, que 
es el que recibe si acelera cuando Alice va despacio. 

Para aplicar el método Harsanyi, hay que imagi- 
narse un movimiento aleatorio que le asigne a Bob 
un tipo, que en este ejemplo corresponde a su mayor 
pago. Por lo tanto, una estrategia pura de Bob esta- 
blece qué acción emprendería dependiendo del tipo 
de jugador que se le asignara. 

Las probabilidades con las que se le asignan a Bob 
los diferentes tipos están determinadas por las creen- 
cias de Alice. Para simplificar las cosas, se asume que 
de todos es sabido que Alice cree que el tipo de Bob 
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despacio deprisa despacio deprisa 


despacio despacio 


deprisa deprisa 


ignorancia de una parte ignorancia de las dos 


partes 


FIGURA 26. Información incompleta en el Juego del Gallina. 


puede estar entre 3 y 9, con la misma probabilidad 
para todos los valores. Si San Francisco de Asís con- 
dujera el coche de Bob, pertenecería sin duda al tipo 
3, pero ni siquiera Atila el huno tiene un tipo mayor 
de 9 en este modelo básico. 

Los subjuntivos implícitos que forman parte de 
esta técnica de hacer modelos generan a veces in- 
quietud. Si Bob sabe que no es un santo, ¿por qué 
debería comportarse como si jugara en un Juego en 
el que podría ser San Francisco de Asís? La razón por 
la cual es necesario que Bob analice cómo se habría 
comportado si hubiera sido los tipos que podría ha- 
ber sido es que Alice no sabe cuál de estos tipos se ha 
hecho realidad. Dado que sus decisiones estratégicas 
dependen de lo que Bob habría hecho si el tipo al 
que pertenece fuera otro del que realmente es, Bob 
no puede decidir qué hacer cuando sabe que su tipo 
es 4/ o 5% sin tomar en consideración a la vez lo 
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que habría hecho si su tipo fuera cualquier otro de 
los posibles. 

Bob sí sabe a qué tipo pertenece, pero Alice ignora 
el resultado del movimiento de asignación de tipos. 
Por lo tanto, ella sólo dispone de dos estrategias, des- 
pacio o deprisa. Bob dispone de un enorme número 
de estrategias, pero sólo analizaremos aquellas en las 
que escoge despacio si su tipo está por debajo de un 
valor determinado, y deprisa si está por encima. 

Previamente hemos localizado tres equilibrios de 
Nash para el Juego del Gallina: dos puros y uno mix- 
to. El equilibrio puro continúa constituyendo un 
equilibrio en el juego con ignorancia de una parte. 
El primer equilibrio corresponde a la convención de 
las damas primero: Alice conduce deprisa y Bob des- 
pacio siempre, independientemente del tipo al que 
pertenece. El segundo equilibrio corresponde a la 
convención los caballeros primero: Alice siempre va 
despacio y Bob siempre deprisa. 

Cuando no se dispone de una convención como 
ésta, como ocurre al conducir con tráfico denso, de- 
bemos mirar hacia una analogía del equilibrio mix- 
to del Juego del Gallina, en la cual cada jugador elige 
despacio y deprisa con la misma frecuencia. Empeza- 

mos haciendo a Alice indiferente entre deprisa y des- 
pacio; entonces, cualquier estrategia mixta le resulta 
óptima. Bob puede hacer a Alice indiferente si elige 
despacio, si su tipo está entre 3 y 6, y deprisa cuando 
su tipo esté entre 6 y 9. Entonces a Alice le parecerá 
que Bob elige deprisa con la misma frecuencia que 
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despacio. Pero Alice no debe jugar deprisa con la 
misma frecuencia que despacio como en el equili- 
brio mixto del Capítulo 2, ya que ahora tiene que ser 
óptimo para Bob cambiar de despacio a deprisa 
cuando su tipo es 6. Para que Bob sea indiferente en- 
tre despacio y deprisa cuando su pago máximo es de 
6, Alice debe jugar deprisa con el triple de frecuencia 
que despacio. 

Nótese cómo la ratio de accidentes aumenta 
cuando hacemos que Alice desconozca a qué tipo 
corresponde Bob. En el equilibrio mixto de la ver- 
sión original del Juego del Gallina, tanto Alice como 
Bob eligen deprisa la mitad de las veces, y, por tanto, 
hay una probabilidad de 1/4 de que ambos conduc- 
tores aceleren y tengan un accidente. En el corres- 
pondiente equilibrio de la versión con ignorancia de 
una parte, la probabilidad de un accidente aumenta 
hasta 3/8. 


Ignorancia de dos partes en el Juego del Gallina 


El segundo ejemplo de la Figura 26 es más divertido 
que el primero, ya que en este caso tanto Alice como 
Bob son ignorantes, pero la simetría del problema lo 
hace todavía más fácil de analizar. 

Seguiremos a Harsanyi una vez más, con la intro- 
ducción de un movimiento aleatorio que le asigna 
independientemente a cada jugador un tipo que su 
adversario considera situado entre 3 y 9, con la mis- 
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ma probabilidad para todas las opciones. El equili- 
brio interesante surge cuando tanto Alice como 
Bob eligen despacio cuando su tipo es de menos de 5 
y deprisa cuando su tipo es de más de 5. Entonces, a 
ambos jugadores les parecería que su oponente 
conduce deprisa con el doble de frecuencia que des- 
pacio. Por lo tanto, un jugador con un pago máximo 
de 5 será indiferente entre elegir deprisa y despacio. 
El juego óptimo para Alice y Bob consiste pues en 
cambiar de despacio a deprisa cuando su tipo llega a 
5. 

La probabilidad de un accidente es ahora de 4/9, 
lo que representa un incremento respecto a la pro- 
babilidad de 3/8 del caso de la ignorancia de una 
parte, pero a continuación vamos a ver que incre- 
mentar el nivel de ignorancia puede en ocasiones 
hacer que los jugadores salgan beneficiados. 


¿La ignorancia es una bendición? 


Alice y Bob están a punto de llegar al equilibrio de 
Nash que acabamos de descubrir para el Juego del 
Gallina, aunque las dos partes lo ignoran. Los dos 
corresponden a un tipo 4, de modo que ambos pla- 
nean conducir despacio. Por lo tanto, no hay posibi- 
lidad de un accidente y cada jugador recibirá unos 
pagos de 3 útiles. 

Pandora es una buena samaritana bien informa- 
da que observa que Alice y Bob basan sus elecciones 
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estratégicas en una premisa falsa. Cada uno se com- 
porta como si su oponente pudiera pertenecer a 
cualquier tipo entre el 3 y el 9, pero el tipo de su opo- 
nente realmente es 4. Por lo tanto, Pandora intervie- 
ne con una declaración pública que pone en conoci- 
miento de todos que tanto Alice como Bob son de 
tipo 4. Por consiguiente, Alice y Bob juegan el equili- 
brio mixto habitual en el Gallina, en el cual cada uno 
de los jugadores juega deprisa la mitad del tiempo y 
despacio la otra mitad. Así que la intervención de 
Pandora incrementa la probabilidad de un accidente 
hasta 1/4 y reduce los pagos medios de Alice y Bob a 
11% útiles. 

Incrementar la información de todos puede, por 
lo tanto, perjudicar a todo el mundo. Un mayor ni- 
vel de información sólo será beneficioso, sin mati- 
ces, para un jugador si lo adquiere secretamente. Por 
lo tanto, si Pandora le contara en secreto a Alice 
cómo es el juego en realidad, Alice cambiaría de des- 
pacio a deprisa y sus pagos mejorarían desde 3 hasta 
4 útiles. 

La conclusión de que revelar información puede 
dañar a la sociedad da pie a una importante cuestión 
ética. ¿Debería ser legítimo que los políticos nos 
ocultaran la verdad por nuestro propio bien? John 
Stuart Mill es quizás el más benigno de una serie de 
filósofos, desde Platón en adelante, que han contes- 
tado sí a esta pregunta, pero mi opinión es que no. 
Mantengo la boca cerrada cuando sé que alguien 
está siendo infiel en su matrimonio, pero quiero que 
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la gente considere correcto tirar de la manta en la es- 
fera pública. Las mentiras que supuestamente con- 
tribuyen al interés público normalmente demues- 
tran beneficiar únicamente a los mentirosos que las 
dicen. 


Dando señales sobre nuestro tipo 


Cuando la gente juega al Gallina en la vida real, bus- 
ca pistas que puedan señalar el tipo de su oponente. 
¿Alice conduce una camioneta pick-up abollada? 
¿Lleva Bob un collar de perro? 

Para señalar el tipo del jugador con eficacia, una 
señal debe ser costosa de realizar. Si a Alice le dan 
una pareja de doses en el Póquer, no le ayudará de- 
cirle a Bob que le han tocado cuatro ases. Los teóri- 
cos de los juegos desprecian esta palabrería inútil y 
la tachan de cheap talk («parloteo»). Bob sólo pres- 
tará atención si Alice respalda sus palabras con dine- 
ro. Pero si ella se marca un farol apostando como si 
tuviera cinco ases, se arriesga a que vayan y pierda la 
apuesta. 

Volviendo al Juego del Gallina con ignorancia de 
las dos partes, supongamos que tanto Alice como 
Bob pueden lanzar simultáneamente una señal cos- 
tosa que diga «pertenezco a un tipo alto, cuidado 
conmigo». Si algunos tipos mandan su señal para 
poner de manifiesto su fuerza, permanecer callado 
se convierte en un signo de debilidad. Por consi- 
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guiente, debemos contemplar un nuevo juego en « 

cual ambos jugadores tengan una oportunidad es 

tratégica de emitir una señal de fortaleza o debilida 

antes de jugar al Gallina. Analizamos un equilibri: 

de perfección en el subjuego determinado, en el cua. 
los jugadores cuyo tipo sobrepasa el 5 lanzan una se 

ñal de fuerza, mientras que los que su tipo es meno: 
de 5 lanzan una señal de debilidad. 

Si Alice afirma que es fuerte mediante una señal \ 
Bob admite implícitamente que es débil al permane 
cer callado, el equilibrio requiere que jueguen al Ga 
llina de acuerdo con la norma: las damas primero. Es 
decir, Alice va deprisa, y Bob, despacio. Si Bob lanza 
la señal y Alice no, juegan de acuerdo con la norma 
los caballeros primero. En ese caso, Bob va deprisa 5 
Alice despacio. 

El caso más interesante surge cuando la señal la 
lanzan los dos o ninguno de los dos. Ya hemos visto 
cómo analizar las versiones resultantes del Juego del 
Gallina con ignorancia de las dos partes. En el caso 
de que ambos emitan una señal, es bien sabido que 
ambos tipos están entre 5 y 9. Entonces, el equilibrio 
de Nash consiste en que los jugadores con un tipo 
menor de 6 elijan despacio y los jugadores con un 
tipo mayor de 6 elijan deprisa. En el caso de que nin- 
guno de los dos mande una señal, es bien sabido que 
ambos tipos se encuentran entre 3 y 5. Entonces se 
llega a un equilibrio de Nash si los jugadores con un 
tipo por debajo de 4 eligen despacio y los jugadores 
con un tipo superior a 4 eligen deprisa. 
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Sólo en la última fase surgen nuevas considera- 
ciones. Emitir la señal debe ser opcional para los ju- 
gadores cuyo tipo es mayor de 5 y permanecer en si- 
lencio debe serlo para aquellos cuyo tipo es menor 
de 5. Un jugador cuyo tipo sea exactamente de 5 será 
entonces indiferente entre emitir o no la señal. Por 
consiguiente, debemos calcular qué espera conse- 
guir un jugador de tipo 5 en los dos casos. Para que 
se sostenga el equilibrio, el coste de afirmar que eres 
duro debe ser igual a la diferencia entre estos dos pa- 
gos. La diferencia resulta ser de 2 1/6 útiles y, por lo 
tanto, el costo de una señal tiene que ser de 2 1/6 
para que el equilibrio funcione. 


Exhibiciones 


Una señal costosa es de una gran importancia a la 
hora de negociar. El retraso se usa mucho con este fin. 
Por ejemplo, durante una huelga, a veces hay quejas 
sobre la irracionalidad de los representantes sindicales 
que no piensan considerar la última oferta hasta den- 
tro de dos martes. Sin duda los representantes sindica- 
les a veces son irracionales, pero unos jugadores racio- 
nales pueden emplear exactamente la misma táctica 
para enviar una costosa señal de fortaleza. En su for- 
ma más cruda, un negociador puede exhibir su forta- 
leza simplemente quemando un montón de billetes. 
La biología ofrece ejemplos maravillosos. Avishag 
Zahavi describe señales costosas mediante el Princi- 
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pio del hándicap. ¿Por qué cantan algunas alond: 
cuando las persigue un halcón? Para enviar la se: 
de que son lo suficientemente rápidas como pau 
escapar, a pesar de que se reducen sus ventajas n) 
diante el canto. Los halcones jóvenes siguen pers 
guiéndolas, pero pronto aprenden a no molesta: 
se. ¿Por qué tienen los pavos reales unas colas ta 
magníficas? Parte de la razón radica en una sele. 


ción sexual clarísima. A las pavas reales les gust. 


las grandes colas, y por lo tanto, los pavos con gran: 
des colas consiguen más hembras. Pero presumibl 
mente las colas de los pavos empezaron siendo sı 
ñales costosas de la salud de estas aves. 


7. Subastas 


En esta ocasión, Alice se convierte en una jefa empe- 
ñada en conseguir que sus subordinados trabajen 
por los objetivos de ella en lugar de hacerlo por los 
suyos propios. En el lenguaje económico, Alice es el 
principal, mientras que sus subordinados son sus 
agentes. 

Alice les podría decir a sus agentes qué hacer ante 
todas las contingencias posibles, pero hay dos razo- 
nes por las que esta economía dirigida resulta noto- 
riamente ineficiente: la primera es que resulta difí- 
cil para el principal supervisar a sus agentes para 
asegurarse de que siguen sus reglas en lugar de ha- 
cer lo que les venga en gana. La segunda razón ra- 
dica en que a menudo los agentes conocen su acti- 
vidad mejor que el principal. 
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Diseño de mecanismos 


Las reglas que Alice puede supervisar e impone: 
crean un juego en el que los agentes participan. Per 
suadir a los agentes para que actúen de acuerdo con: 
los objetivos del principal en lugar de con los suyos 
propios en situaciones en las que Alice es incapaz de 
supervisar o que no puede regular por falta de cono 
cimientos supone que ella tiene que inventarse in 
centivos adecuados para motivar a los agentes. |! 
problema de encontrar un buen sistema de regula 
ciones e incentivos se llama diseño de mecanismos 

La principal intuición que aporta la teoría de jue 
gos es que habría que esperar que la gente cambiar. 
de comportamiento tras la introducción de un: 
nueva reforma; su comportamiento se iría ajustan 
do hasta que finalmente se estableciera un equilibri 
de Nash para el nuevo juego. Por lo tanto, cuand: 
Alice evalúa un posible nuevo mecanismo, deberi. 
preguntarse hasta qué punto le gusta lo que pasan: 
después de que los agentes se hayan desplazado a u1. 
equilibrio del nuevo juego. El error casi universa; 
que cometen los principales en la vida real consis!. 
en que, en lugar de ello, lo que se preguntan es hast. 
qué punto les gusta lo que pasará antes de que lo. 
agentes aprendan los rudimentos básicos del nuev: 
Juego. 

En un ejemplo de la vida real, el nuevo directo: 
del organismo gestor de los planes de salud de | 
universidad se pronunció a favor de la abolición d 
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los mecanismos de cofinanciación. Éstos requieren 
que pagues cerca de las primeras 100 libras de cual- 
quier prestación que solicites con el objetivo de de- 
salentar el uso frívolo del servicio. Para compensar 
la pérdida de ingresos, propuso que se incrementa- 
ran las primas lo suficiente como para cubrir los in- 
gresos del año anterior. Cuando el economista del 
comité objetó que las cuotas tendrían que incre- 
mentarse más que eso, se llevó a cabo una votación 
para ver si alguien más pensaba que «la gente iría al 
médico sin necesidad». Sólo el economista votó sí a 
esta tendenciosa pregunta, pero al año siguiente no 
había dinero suficiente para pagar las facturas. 

El Congreso de los Estados Unidos cometió un 
error mayor en 1990 cuando aprobó una ley que 
pretendía asegurarse de que Medicare no pagara por 
las medicinas una cifra significativamente superior 
a la de la sanidad privada. Las disposiciones básicas 
de la ley establecían que las medicinas deberían ven- 
derse a Medicare a no más de un 88% del precio me- 
dio de venta. El problema lo produjo una disposi- 
ción adicional que establecía que a Medicare debería 
ofrecérsele un precio al menos tan bueno como a 
cualquier minorista. Esta disposición sólo respon- 
dería a las intenciones de sus creadores si pudiera 
confiarse en que los fabricantes de medicamentos 
ignoraran los nuevos incentivos que la ley abría para 
ellos. Pero ¿por qué venderían los fabricantes farma- 
ccuticos una medicina a un minorista a menos del 
88% del precio medio si la consecuencia es que en- 
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tonces deben venderle la misma medicina al misme 
precio a un cliente gigantesco como Medicare? No 
obstante, si no se venden medicinas a menos de un 
88% de la media existente, el precio medio se vera 
forzado a subir. 

En 2006, los demócratas liberales británicos pro- 
pusieron la introducción de impuestos ecológicos 
que permitieran una reducción del impuesto sobre 
la renta por un total de 12.000 millones de dólares. 
La propuesta no sólo fue incapaz de percibir que la 
gente modifica su comportamiento como respuesta 
a los nuevos impuestos, sino que ¡el propio propósi- 
to de un impuesto ecológico consiste precisamente 
en modificar el comportamiento! 

Nadie propondría nunca construir un avión o un 
puente sin dedicarle un análisis cuidadoso a cómo 
respondería el mecanismo a las tensiones y presio- 
nes que afrontará una vez construido, pero la idea 
de que se le preste la misma atención y cuidado al 
diseño de los mecanismos sociales suele acogerse 
con desdén. Una vez provoqué una carcajada desca- 
rada cuando sugerí que podría gastarse algo de di- 
nero en poner a prueba una gran reforma de un la- 
boratorio de psicología para ver si funcionaba antes 
de ponerla en práctica. Incluso el diseño de subas- 
tas de alto nivel se deja a menudo en manos de ama- 
teurs que no saben absolutamente nada de nada, ni 
siquiera de las ideas más sencillas que se exponen en 
este capítulo. 
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La decisión salomónica 


Cuando tuvo que enfrentarse a dos mujeres que 
se peleaban alegando que eran madres del mismo 
bebé, el rey Salomón hizo su célebre propuesta de 
dividir al niño en dos, de modo que cada deman- 
dante pudiera quedarse una mitad. La madre falsa 
aceptó la decisión, pero a la madre verdadera se le 
conmovieron las entrañas por su hijo y suplicó que 
le dieran el niño a su rival antes de que lo partieran 
en dos. En ese momento, Salomón reconoció a la 
madre verdadera y le entregó el bebé. 

En realidad, la historia bíblica no confirma dema- 
siado la supuesta sabiduría proverbial de Salomón. 
Su plan habría fallado si la madre falsa hubiera goza- 
do de una mente más estratégica. Así que, ¿qué plan 
funcionaría mejor? 

Salomón es el principal. El demandante y el acu- 
sado son los agentes. Trudy es la madre verdadera, 
mientras que Fanny es la madre falsa. Para mantener 
la simplicidad, suponemos que todos saben que 
'Trudy pagaría todo lo que tiene en el mundo por su 
bebé, pero Fanny pagaría sólo una cantidad menor. 

El objetivo de Salomón consiste en entregar el 
bebé a la madre verdadera, pero no sabe de qué tipo 
es cada agente. Podría preguntárselo a ellas, pero 
Fanny no tiene ningún incentivo para decir la ver- 
dad. Así que Salomón sigue la metodología de Har- 
sanyi e imagina un movimiento aleatorio que o bien 
le otorga a Trudy el papel de demandante y a Fanny 
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la acusada se queda 
con el niño, ambas 
son multadas 


la demandante 
se queda con el niño, 
sí no hay multa 
HO 


acusada 


la acusada se queda 
el con el niño, 
no hay multa 
no 


demandante 


¿Eres la madre? 


movimiento. 


Regulaciones Incentivos 


FIGURA 27. La decisión salomónica. El diagrama de la der. 
muestra el juego desde el punto de vista de Salomón cua. 
Trudy valora al bebé en 3 siclos, Fanny valora el bebé en | s 
Salomón establece una multa de 2 siclos. 


el de acusada o bien a Trudy el de acusada y a Fanın - 


de demandante. 
La Figura 27 muestra las reglas de un mecanisn 


que consigue el mejor resultado, consistente en « 


tregar el bebé a la madre verdadera con certeza. i 
demandante juega primero y decide si declara que : 
la madre o no. Si niega ser la madre, el niño se ent:. 
ga a la acusada. Si declara ser la madre, la acusa 


debe declarar si afirma o no ser la madre. Si niega « 


la madre, el bebé se entrega a la demandante. 
Si ambas mujeres afirman que son la madre. « 


bebé se le entrega a la acusada y ambas mujeres su 
multadas. 
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Salomón debe emplear su famosa sabiduría para 
establecer los incentivos para Fanny y Trudy. La 
multa debe ser mayor que la valoración del bebé que 
hace Fanny, pero menor que la valoración de Trudy. 
Las líneas engrosadas de la Figura 27 muestran, por 
lo tanto, el resultado de aplicar la retroinducción. 
Cuando los actores usan este equilibrio de perfec- 
ción en el subjuego, Trudy siempre se hace con el 
niño y no se paga multa alguna. 


Aplicaciones económicas 


Los grandes éxitos del diseño de mecanismos se 
encuentran en las subastas y en la economía regu- 
latoria. Los miles de millones de dólares cosecha- 
dos por las subastas de telecomunicaciones han 
atraído mucha atención, pero las aplicaciones re- 
gulatorias probablemente tienen más relevancia a 
largo plazo. 

Los peces gordos que sufren la regulación vocife- 
ran mucho sobre las ventajas del libre mercado, 
pero saben que las buenas propiedades de los mer- 
cados perfectamente competitivos sólo se aplican 
cuando existe un número elevado de pequeños ven- 
dedores y compradores. Cuando únicamente hay 
un pegueño número de vendedores, siempre aca- 
ban aprovechando su poder en el mercado para fas- 
tidiar al consumidor, a menos que lo evite la regula- 
ción gubernamental. 
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Los partidarios del libre mercado tienen razó1 
afirmar que la ausencia de regulaciones suele ser 1 
Jor que las malas regulaciones, como las que nos h. 
endilgado mayoritariamente en el pasado, pero u: 


regulación no tiene que ser necesariamente mai 


Regulaciones mejores, que emplean los principi. 
del diseño de mecanismos, se están imponiendo an: 
la oposición de varios gurús cuyos consejos han cor 
vertido en innecesarios. Pero no tengo espacio pas 
tratar con seriedad la economía regulatoria aquí 
que el resto del capítulo tratará de las subastas. 


yal 


William Vickrey 


Las subastas confirman la rama de la teoría de jue 
gos en la que más se ha avanzado. También es el áre. 
en la que la teoría de juegos ha sido empleada con u, 
éxito más espectacular para resolver problemas apli 


cados. La cantidad de dinero conseguida en subasta: 


de telecomunicaciones diseñadas por teóricos delo: 
Juegos es astronómica. 

Años ha, los gobiernos solían organizar lo que 
acabó conociéndose por «concursos de belleza» a la 
hora de asignar activos públicos valiosos a empresas 
privadas. Cada empresa presentaba un magnífico 
documento que explicaba por qué debería ser ésta la 
que recibiera el activo en lugar de una de sus rivales. 
Un comité de funcionarios del gobierno decidiría a 
continuación qué documento les gustaba más. Pero 
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normalmente los funcionarios no tenían ni idea del 
valor comercial de los activos que vendían. Los par- 
ticipantes en el concurso de belleza tampoco les de- 
cian la verdad. A menos que les beneficiara, ¿por qué 
iban a decirles la verdad los agentes a los principales? 
Necesitarían que les ofrecieran incentivos apropia- 
dos antes de desprenderse de la información que ne- 
cesita el principal. Las subastas convencen a los 
agentes de decir la verdad porque les hacen respal- 
dar sus palabras con dinero. 

William Vickrey es el héroe de la teoría de las su- 
bastas. Defendía el uso de subastas especificamente 
diseñadas para la venta de activos públicos impor- 
tantes treinta años antes de que la idea se generaliza- 
ra. La Comisión Federal de Comunicaciones no hizo 
caso de estos argumentos hasta que el mensaje llegó 
finalmente al Congreso, que insistió en que el si- 
guiente paquete de frecuencias de telecomunicacio- 
nes debía venderse por subasta. Un diseño realizado 
por un grupo de teóricos de los juegos liderados por 
Paul Milgrom recaudó a continuación un total de 
20.000 millones de dólares de ingresos. 

Un equipo que yo mismo lideré diseñó más subas- 
tas de telecomunicaciones en Gran Bretaña, Bélgica, 
Dinamarca, Grecia, Hong Kong e Israel. La subasta 
de Gran Bretaña recaudó por sí sola 35.000 millones 
de dólares. Tras la caída del índice NASDAQ en 2001 
y el consiguiente pinchazo de la burbuja de las em- 
presas tecnológicas, se oyeron muchos lamentos, ya 
que los ejecutivos de las empresas de telecomunica- 
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ciones intentaban culpar de su propia incapaci: 
para analizar correctamente el mercado a los teór:. . 
de los juegos que supuestamente les hicieron pa: 
por las licencias más de lo que valían. Pero ¿quí 


sino un idiota pujaría por una cosa más de lo u > 


cree que vale? 

Creo que el alboroto solamente sirvió para sub» 
yar lo eficaces que pueden ser los teóricos de los ju. 
gos cuando se les permite aplicar la disciplina del «1 
seño de mecanismos a gran escala. Obviamente. 
Comité del Nobel pensaba lo mismo y, aunque t.: 
díamente, le concedió el Premio Nobel a Vickro, 


pero éste murió tres días después de recibir la nor: 
ficación. 


Tipos de subasta 


Las subastas no son nada nuevo. Herodoto descril. 
la subasta de esposas no deseadas en la antigua Bal»: 
lonia. Tampoco las subastas de alto nivel constituye: 
una novedad. En el año 193 d.C. la guardia pretori. 
na subastó el Imperio Romano, que pasó a manos «| 
un tal Didio Juliano. A continuación, se relaciona: 
algunos de los tipos de subastas de uso corriente. 


Subasta inglesa 


Sotheby's utiliza este tipo de subasta para vende 
obras maestras. Un subastador invita a pujar en vo, 
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FIGURA 28. «¡A la una, a las dos, a las tres!» 


alta. Las pujas se suceden hasta que nadie más quiere 
pujar. Tradicionalmente, el subastador grita: «¡A la 
una, a las dos, a las tres!». l 

Si nadie le interrumpe con una nueva puja, golpea 
la madera con la maza y se le vende el objeto al últi- 


mo en pujar. 


Subasta holandesa 


El subastador empieza anunciando un precio eleva- 
do, que gradualmente se va bajando hasta que un 
comprador pide parar. El primer comprador que lo 
haga adquiere el objeto al precio que le correspondía 
cuando intervino. 

Las subastas holandesas pueden ser rápidas, por 
lo que se emplean para vender bienes perecederos, 
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como pescado o flores cortadas. En la subasta de fle 
res de Amsterdam, un vendedor puede recibir flor: 


desde Zambia por vía aérea y el comprador pued. 


enviarlas a Chicago para su venta en un solo día. N: 


obstante, en ocasiones se llevan a cabo este tipo d: 


subastas a cámara lenta en tiendas de muebles usa 


dos que reducen el precio de los objetos no vendido 
un 10% cada mes. 


Subastas de primer precio y ofertas selladas 


Es el formato estándar de las ofertas gubernamenta 
les. Cada comprador potencial escribe su puja en s 
creto en un trozo de papel y la introduce en un sobr: 
cerrado. El vendedor se compromete a vender el ob 


jeto a aquel que haga la oferta más alta y al preci: 
que pujó. 


Subastas Vickrey 


En las subastas Vickrey, el objeto se vende al que má: 
puja mediante un mecanismo de oferta sellada, per 
al precio más alto de entre las pujas de perdedores 
Ello corresponderá a la segunda oferta más alta, « 
menos que haya un empate en la primera plaza, er 
cuyo caso el ganador se elige aleatoriamente entre 
los mayores apostantes. 

Milton Friedman lideró una campaña irrespon 
sable pero exitosa para persuadir al gobierno esta 
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dounidense de que sustituyese el formato de las su- 
batas de bonos del Tesoro, por lo que los gurús fi- 
nancieros lo llaman «subasta al segundo precio», 
pero se equivocaba al suponer que estaba defen- 
diendo la generalización apropiada de la subasta de 
Vickrey a un caso en el que muchos objetos idénti- 
cos están a la venta. 

Es sólo un ejemplo de fenómeno angustiante. In- 
cluso en los pocos casos en los que los teóricos de los 
juegos conocen la respuesta a un problema, los fun- 
cionarios del gobierno prefieren el consejo de falsos 
profetas con mejores relaciones públicas. 


Subastas óptimas 


Alice quiere vender su casa, que para ella no vale 
nada si no encuentra comprador. Los únicos com- 
pradores potenciales son Bob y Carol. ¿Qué diseño 
de subasta debería usar Alice? 

El problema de Alice es similar al del rey Salo- 
món. No sabe en qué cantidad valoran Bob y Carol 
su casa. Si conociera sus valoraciones, simplemente 
les haría una oferta de «lo tomas o lo dejas» un cén- 
timo por debajo de la mayor de las dos valoraciones. 
Entonces sería racional para el pujador con la mayor 
valoración aceptar la oferta, puesto que un beneficio 
de un céntimo es mejor que nada. Este análisis de- 
pende en gran medida del hecho de que Alice tenga 
la capacidad de adquirir un compromiso irrevoca- 
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ble con las reglas del Juego del Ultimátum. El diseño 
de mecanismos no funciona en absoluto si los agen- 
tes no creen que el principal cumplirá las reglas del 
Juego que se inventa para que jueguen. 

Dado que Alice no conoce las valoraciones de Bob 
y Carol, sigue la metodología de Harsanyi de mode- 
lizar la incertidumbre de sus valoraciones mediante 
un movimiento aleatorio. En el caso más simple, el 
movimiento aleatorio asigna a Bob y Carol las valo- 
raciones de forma independiente, así que nada de lo 
que sepas sobre la valoración de un agente te aporta 
información nueva sobre la valoración del otro 
agente. Para ser concreto, estableceré el supuesto de 
que la valoración de la espléndida casa de Alice por 
parte de cada agente se halla entre 0 y 36 millones de 
dólares, con la misma probabilidad para cualquier 
valor del rango. 

La mayoría de la gente se sorprende al descubrir 
que todos los diseños de subastas analizados en la 
sección anterior resultan óptimos para Alice si todo 
el mundo intenta maximizar su media de beneficios 
en dólares. Alice debería establecer un precio de re- 
serva de 18 millones de dólares y a continuación 
cualquiera de los diseños, el que mejor le parezca, 
porque todos ellos le proporcionan los mismos be- 
neficios de 15 millones de dólares. 
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Precios de reserva 


Nótese que Bob se quedará sin pujar la mitad de las 
veces, al ser su valoración inferior al precio de re- 
serva de Alice. Dado que lo mismo puede decirse 
de Carol, Alice no le venderá su casa a nadie una 
vez de cada cuatro. Si eso pasara, Alice no debería 
hacer trampas respecto a sus propias normas su- 
bastando la casa de nuevo con un precio de reserva 
más bajo, ¡a menos que no le importe que en el fu- 
turo los agentes no la crean cuando vuelva a ejercer 
de principal! 

He aconsejado a muchos gobiernos sobre el dise- 
ho de subastas de alto nivel, pero nunca he tenido 
éxito a la hora de persuadir a los funcionarios res- 
ponsables de establecer un precio de reserva tan alto 
como el que deseaba. Tampoco he tenido nunca 
confianza alguna en que los funcionarios entendie- 
ran que no debían devolver el objeto en venta inme- 
diatamente al mercado si no se alcanzaba el precio 
de reserva. Pero mis esfuerzos en este frente no fue- 
ron del todo en vano, ya que proporcionan una ex- 
cusa para, en lo que sigue, analizar solamente el caso 
de un precio de reserva cero. Todos los diseños de 
subasta analizados hasta ahora consiguen la misma 
media de ingresos, independientemente del precio 
de reserva, pero es más fácil de explicar el porqué en 
el caso en que se pueda contar con que pujarán to- 
dos los compradores potenciales. 
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Equivalencia de los beneficios 


En un equilibrio de Nash simétrico, los agentes co- 
valoraciones más altas harán pujas más altas en to 
das las subastas analizadas hasta ahora. Así que « 
agente con la valoración más elevada ganará. La pro 
babilidad de que un agente con una valoración dı 
terminada gane la subasta es la misma para todos lo: 
diseños. 

¿Qué espera pagar de media el agente? En cad.: 
una de nuestras subastas, la respuesta resulta ser lu 
mitad de la valoración del agente. Se deduce que los 
ingresos medios de Alice deben ser los mismos cor 
todos los diseños. Dichos ingresos medios resultan 
ser de solamente 12 millones de dólares, pero esto es 
lo máximo que puede esperar Alice si Bob y Caro! 
pujan racionalmente y ella establece un precio de re- 
serva de cero. 

¿Por qué debería esperar el ganador un coste de 
sólo la mitad de su valoración? El caso de una subas- 
ta inglesa es el más sencillo. Es obvio que Bob y Ca- 
rol deberían seguir pujando hasta que el precio al- 
canzara su valoración para, a partir de ese punto, 
callarse. Así que la puja terminará cuando los pre- 
cios alcancen la más baja de las valoraciones de los 
Jugadores. Dado que todos los valores inferiores a la 
valoración del ganador tienen la misma probabili- 
dad de constituir la valoración del perdedor, su va- 
lor medio es de la mitad de la valoración del ga- 
nador. 
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Ahora es posible entender por qué la subasta de 
Vickrey es esencialmente lo mismo que una subasta 
inglesa. Si Bob y Carol le presentaran a Alice sus 
verdaderas valoraciones y ésta le vendiera la casa 
al mayor pujador al precio equivalente a la segunda 
mayor puja, los beneficios medios de Alice serán 
exactamente los mismos que los que comportaría 
una subasta inglesa. Pero ¿por qué tendría que espe- 
rar Alice a que Bob y Carol pujaran con sus verda- 
deras valoraciones? 

La respuesta es que esta estrategia domina al resto 
de alternativas de los agentes. Si el otro agente ha pu- 
jado por debajo de tu valoración, te aseguras la vic- 
toria sin que ello afecte el precio que pagas por pujar 
la cifra de tu valoración. Si el otro agente ha pujado 
una cifra más alta que tu valoración, no quieres ga- 
nar y, por lo tanto, también podrías hacer una puja 
equivalente a tu valoración. 

¿Qué hay de la subasta holandesa? Bob y Carol 
podrían escribir el precio llegados al cual planean 
poner fin a la subasta en un trozo de papel y dejar 
que Alice implementara la estrategia por ellos. Por 
consiguiente, una subasta holandesa es esencial- 
mente lo mismo que una subasta a primer precio 
con ofertas selladas. Así que si podemos calcular lo 
que Bob y Carol meterían en sus sobres en este últi- 
mo tipo de subasta, también sabremos cuándo ten- 
drían pensado parar la subasta holandesa. 
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Rebajar tu puja 


¿Qué puja deberías introducir en el sobre en una 
subasta a primer precio con ofertas selladas? Cier- 
tamente, no pujarás de acuerdo con tu valoración 
auténtica, porque tu beneficio sería de cero si gana- 
ras. Tienes que rebajarla. Pero ¿cuánto? Ya desvelé el 
secreto cuando explicaba por qué todos nuestros 
diseños de subasta consiguen los mismos ingresos. 
Tanto Bob como Carol deberían pujar sólo la mitad 
de sus respectivas valoraciones. 

Este hecho suele probarse mediante cálculo, pero 
pienso explicarlo utilizando la jardinería paisajísti- 
ca. ¿Qué forma debería tener un jardín si quieres ce- 
rrar el máximo espacio con una longitud fija de va- 
lla? La respuesta es, obviamente, un círculo. Si el 
Jardín tiene que ser rectangular, la respuesta es un 
cuadrado. 

Volviendo al problema de encontrar un equilibrio 
de Nash simétrico para una subasta a primer precio 
con ofertas selladas, imaginémonos que es de todos 
sabido que Carol hará una puja proporcional a su 
valoración. La probabilidad de ganar de Bob será 
por tanto proporcional a la puja que haga, sea cual 
sea. Bob quiere maximizar sus beneficios medios, 
que son el producto del beneficio que obtiene si 
gana y su probabilidad de ganar. Este producto es 
proporcional al área de un jardín rectangular cuya 
longitud es la ganancia si gana, y cuya anchura es su 
puja. 
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Dado que si gana los beneficios equivaldrán a la 
diferencia entre su valoración y su puja, la longitud 
de la valla del jardín es proporcional a su valoración. 
Por consiguiente, la valla tiene la misma longitud in- 
dependientemente de la puja que haga. Así que de- 
cidir la mejor respuesta de Bob se reduce a calcular 
qué jardín rectangular tiene la mayor área cuando se 
cierra con una valla de longitud fija. Dado que la res- 
puesta es un cuadrado, la mejor respuesta de Bob 
consiste en hacer una puja igual a la diferencia entre 
su valoración y su puja, de lo que se deduce que su 
puja óptima equivale a la mitad de su valoración. 
Por lo tanto, su puja será proporcional a su valora- 
ción, y la puja óptima de Carol también será de la 
mitad de su valoración. 


Subastas en las que todos pagan 


Los profesores de cursos de teoría de juegos son muy 
aficionados a subastar un dólar de acuerdo con las 
normas siguientes. Se puja como en una subasta ingle- 
sa y el jugador con la puja más alta gana el dólar, pero 
todos pagan la puja más alta, incluidos los que no ga- 
nan el dólar. Ver la expresión de las caras de los alum- 
nos cuando la apuesta se acerca a un dólar y los perde- 
dores se dan cuenta de que ahora vale la pena apostar 
más de un dólar puede resultar muy entretenido. 
Sobornar a políticos o jueces corruptos es en gran 
medida como una subasta en la que todos pagan con 


180 TEORIA DE JUEGOS 
LA TEORÍA DE JUEGOS. UNA BREVE INTRODUC: H 


ofertas cerradas. Todo el mundo paga, pero sólo « 
que soborna puede tener éxito. Si entre los ladrone 
cabe el honor, será el soborno más alto el que se llev 
el gato al agua. 

Las subastas en las que todos pagan se mencionan 
en esta sección solamente para argumentar que cl 
resultado de la equivalencia de beneficios se aplica 
de una manera muy generalizada. Obviamente, los 
agentes rebajarán mucho más sus apuestas en una 
subasta con ofertas selladas en la que todos pagan 
que en una a primer precio con ofertas selladas, pero 
los beneficios medios de Alice seguirán siendo de 
12 millones de dólares. 


Subastas a medida 


Los que escriben de economía en los periódicos a ve 
ces citan los resultados de equivalencia de los benefi 
cios cuando argumentan erróneamente que nunca 
importa qué tipo de subasta emplea el vendedor. Pero 
dicho resultado desaparece si Bob y Carol tienen pre- 
supuestos limitados o son aversos al riesgo. En ese 
caso, Alice consigue más en una subasta holandesa 
que en una subasta inglesa. Tampoco se sostiene si las 
valoraciones de Bob y Carol dejan de ser indepen- 
dientes la una de la otra. En ese caso Alice esperará 
más de una subasta inglesa que de una holandesa. 
Cuando una subasta de alto nivel va a llevarse a 
cabo, es de suma importancia que sus reglas se ajus- 
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ten a las circunstancias. Por ejemplo, si de algún 
modo Alice supiera que las cantidades en las que es 
posible que Bob y Carol valoren su casa son de 27 y 
36 millones de dólares, no debería llevar a cabo nin- 
guna de las subastas analizadas hasta ahora. Si las 
dos posibilidades son igual de probables, ¡debería 
realizar una subasta a oferta sellada en la cual el ga- 
nador pague la media de las dos pujas! 


La maldición del ganador 


Los agentes con valores privados conocen sus valo- 
raciones antes del inicio de la subasta, y nada de lo 
que pudieran aprender durante el evento les llevaría 
a cambiarlas. Todas las subastas que hemos analiza- 
do hasta ahora se han tratado como subastas de va- 
lor privado, en las cuales todos saben que el valor del 
objeto a la venta es el mismo para todos los compra- 
dores potenciales. 

Por ejemplo, cuando se subastan licencias para 
perforar pozos de petróleo en el fondo marino, la 
cantidad de petróleo en un terreno es la misma 
para todo el mundo, pero las estimaciones de los 
compradores sobre cuánto petróleo es probable 
que haya en un terreno dependerán de informes 
geológicos diferentes. Dichos informes no sólo son 
caros, sino también notoriamente carentes de fiabi- 
lidad. Algunos compradores potenciales recibirán 
por lo tanto informes optimistas y otros recibi- 
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rán informes pesimistas. Así que, ¿quién ganará la 
subasta? 

Si Bob trata la estimación que hace su informe so- 
bre el valor del terreno como un valor privado, ga- 
nará siempre que su informe sea el más optimista. 
Pero cuando Bob se dé cuenta de que su victoria en 
la subasta implica que todos los demás informes son 
más pesimistas que el suyo, ¡maldecirá la mala suerte 
que ha tenido al ganar! Si desde el principio hubiera 
sabido que todos los demás informes eran más pesi- 
mistas que el suyo, no habría pujado tan alto. 

Como en la subasta en la que todos pagan, a los 
profesores de teoría de juegos les gusta pillar despre- 
venidos a sus alumnos atrapándolos en una subasta 
de valor común. Un vaso lleno de monedas y billetes 
arrugados de valores diversos se subasta a la puja 
máxima, que suele desembocar en la maldición del 
ganador y, por consiguiente, resulta en unas pérdi- 
das sustanciales. 


El Juego de la Billetera 


Para evitar la maldición del ganador, los jugadores 
deben tener en cuenta la información que aportan 
las pujas de sus rivales respecto a cuánto piensan que 
vale el objeto a la venta. El Juego de la Billetera es un 
ejemplo básico. 

Alice confisca las billeteras de Bob y de Carol y a 
continuación recurre a una subasta inglesa para 
venderles la suma de sus contenidos. 
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Un equilibrio de Nash tiene lugar si ambos juga- 
dores planean seguir pujando hasta que el precio al- 
cance el doble del dinero que tenían en su propia bi- 
lletera. Si Carol apuesta así, Bob sufrirá la maldición 
si gana por apostar más del doble de lo que hay en 
su propia cartera. Por lo tanto, él sabe que la canti- 
dad de dinero de su propia cartera es inferior que la 
mitad del precio final. También sabe que la cantidad 
de dinero en la billetera de Carol es de menos de la 
mitad del precio final, porque ha parado de pujar. 
Por lo tanto, la cantidad total de dinero que ha gana- 
do Bob debe ser menor que la mitad de lo que pagó 
por él. 


8. Biología evolutiva 


Los biólogos gozan de una enorme ventaja respec- 
to a los científicos sociales a la hora de aplicar la 
teoría de juegos porque tienen muchos más datos. 
La selección natural ha generado una gran varie- 
dad de especies distintas, algunas de las cuales son 
tan raras y maravillosas que parecen desafiar a las 
explicaciones racionales. Pero ¿qué podría ser más 
satisfactorio que aprender finalmente por qué la ge- 
nética inusual de los Hymenoptera explica la desi- 
gual ratio por géneros de determinadas especies de 
abejas? ¿O por qué dos variantes muy distintas de la 
perca de agallas azules son capaces de coexistir jun- 
tas en un mismo lago? Negar la evolución ante la vi- 
sión de estos ejemplos me parece como imitar a los 
teólogos que se negaban a mirar a través del telesco- 
pio de Galileo. 

Resulta todavía más notable el hecho de que in- 
cluso los juegos más básicos a veces serán suficientes 
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para condensar con éxito en un modelo algún tipo 
de comportamiento animal. Realmente nadie cree, 
por ejemplo, que la reproducción entre pájaros ten- 
ga lugar sin sexo o que el proceso evolutivo sea de- 
terminista. Pero, como en la física, los modelos re- 
sultantes de hacer estas simplificaciones heroicas a 
veces se ajustan increíblemente bien a los datos. 


La teoría de juegos evolutiva 


Herbert Spencer resumió la teoría de la evolución 
como la supervivencia del más apto. Cuando pregun- 
tamos por qué los animales de algunas especies se 
comportan como lo hacen, estamos buscando una 
respuesta que explique por qué los rasgos de com- 
portamiento alternativos eran menos aptos. Sin em- 
bargo, ¿cómo debe definirse la aptitud? 

La definición de Bill Hamilton hace inevitable que 
modelizar el comportamiento animal se reduzca a 
veces a encontrar el equilibrio de Nash de los juegos. 
Consideraba que la aptitud de un rasgo de compor- 
tamiento consistía en el número medio de hijos ex- 
tra que dicho rasgo conllevaba para la siguiente ge- 
neración como resultado de que el rasgo estuviera 
presente en la generación actual. Con esta defini- 
ción, los rasgos de comportamiento pueden identi- 
ficarse con estrategias, y la aptitud, con la utilidad. 

Cuando los animales compiten, podemos imagi- 
narnos que la suerte ocasionalmente selecciona dos 
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o más individuos de las poblaciones relevantes para 
jugar a un juego. Un famoso juego en ecología es el 
del depredador y la presa, que resulta en que los nú- 
meros de linces y liebres canadienses oscilen en ci- 
clos indefinidamente. No obstante, este capítulo se 
centrará en juegos desarrollados por una sola espe- 
cie y con resultados estables. Por ejemplo, ¿qué de- 
termina el tiempo que esperará una mosca del es- 
tiércol macho en una boñiga de vaca a una hembra 
para reproducirse? Dado que el problema estratégi- 
co es el mismo para todas las moscas del estiércol, 
podemos centrar nuestra atención en los equilibrios 
de Nash simétricos de juegos simétricos. 

Un juego simétrico tiene el mismo aspecto para 
todos sus jugadores. En un equilibrio simétrico, to- 
dos los jugadores emplean la misma estrategia. Una 
variante del teorema de Nash demuestra que todos 
los juegos simétricos finitos tienen, por lo menos, un 
equilibrio de Nash simétrico. 


Replicadores 


Desgraciadamente, las aguas filosóficas se han en- 
turbiado por la controversia sobre quién o qué debe 
considerarse jugador en un juego evolutivo. ¿Las es- 
pecies en pleno?, ¿un animal individual?, ¿un pa- 
quete de material genético?, ¿o un gen individual? 
El título del libro de Richard Dawkins El gen egoísta 
parece explicarnos dónde se sitúa en este asunto, 
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pero en realidad adopta la visión más sofisticada de 
que todo lo que se reproduce a sí mismo puede con- 
siderarse como la unidad fundamental en un juego 
evolutivo. 

Al igual que la anciana señora que una vez oí que 
le hizo pasar un mal rato a Dawkins por señalarle 
que los genes son sólo moléculas y, por lo tanto, no 
pueden gozar de libre albedrío, la gente a menudo 
considera paradójico que la teoría de juegos pueda 
aplicarse con éxito a la biología evolutiva. ¿Cómo 
puede un insecto participar en un juego? Los insec- 
tos carecen de razón. Su comportamiento es en gran 
medida instintivo. Sólo hacen lo que están progra- 
mados para hacer. 

La solución de la paradoja es que no se debe for- 
mar necesariamente a los animales objeto de estudio 
como jugadores del juego. Si el comportamiento 
que se investiga es en gran medida instintivo, se en- 
cuentra codificado en los genes del animal. Podría 
pensarse en los genes como parte del hardware de un 
ordenador natural: la parte en la que se almacenan 
los programas del ordenador; algunos de estos pro- 
gramas controlan el comportamiento del animal. 

Una propiedad importante de los programas de 
ordenador es que pueden copiarse de un ordenador 
a otro. Los virus de ordenador se copian a sí mismos 
de un ordenador a otro, se autorreplican. Los progra- 
mas grabados en los genes de los animales también 
se autorreplican. Pero su replicación es inmensamen- 
te complicada en comparación con la replicación de 
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los virus informáticos. La naturaleza no solamente 
debe copiar programas de un ordenador natural a 
otro, sino que tiene que crear un nuevo ordenador 
natural al que sea posible copiar los programas. El 
descubrimiento de Crick y Watson sobre cómo re- 
suelve la naturaleza esta cuestión mediante el dispo- 
sitivo de la doble hélice constituye una de las grandes 
historias de la aventura científica. Pero de esta emo- 
ción habrá que disfrutar en otro momento. Lo im- 
portante aquí es que entendamos que existe algo que 
hace dos cosas: 


e Se replica a sí mismo. 
* Determina el comportamiento estratégico en 
un juego. 


Cuando encontremos en un modelo un ente al 
que le podamos atribuir estas dos propiedades, lo 
llamaremos replicador. 

Ciertamente, los genes pueden ser replicadores. A 
veces los detractores se quejan de que no es probable 
que una mutación en un solo gen tenga muchos 
efectos, pero incluso la mínima modificación de un 
rasgo de comportamiento puede ser significativa 
cuando se calcula la media de aptitud en un periodo 
lo suficientemente largo. Los paquetes de material 
genético que tienden a replicarse juntos también 
cuentan como replicadores. En las especies parteno- 
genéticas, como el gorgojo de la harina, una madre 
transmite toda su información genética a sus crías, 
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en cuyo caso también podría decirse que cada tipo 
individual de animal es un replicador. 

Para sobrevivir, los replicadores necesitan hués- 
pedes en cuyos genes imprimirse. Hemos definido la 
aptitud de un huésped como una medida de la fre- 
cuencia con que replica sus genes. Así que casi se 
convierte en una tautología la afirmación de que los 
replicadores que confieren una elevada aptitud a sus 
huéspedes llegarán a controlar a un mayor número 
de huéspedes que aquellos que les confieren una ap- 
titud baja. Si el entorno sólo mantiene un pequeño 
número de huéspedes, el replicador que confiera 
una baja aptitud a sus huéspedes acabará por desa- 
parecer por completo. En ese caso, habrá sobrevivi- 
do el replicador más apto. 

Si Alice está observando cómo evoluciona la si- 
tuación, podría intentar darle sentido a lo que ve 
atribuyendo un objetivo o propósito a todo meca- 
nismo que genere replicadores: el de maximizar la 
aptitud de sus huéspedes. Si la selección natural ope- 
ra durante el tiempo suficiente en un entorno esta- 
ble, sólo los replicadores que sean eficientes en la 
maximización de la aptitud de sus huéspedes sobre- 
vivirán. Así pues, para Alice será como sí algo estu- 
viera eligiendo conscientemente replicadores para 
maximizar la aptitud. A ese algo imaginario le lla- 
maremos «jugador». 

Por ejemplo, cuando los replicadores son conside- 
rados variantes de un solo gen, podemos imaginar al 
jugador sentado en el locus del cromosoma donde se 
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sitúa ese gen en concreto. Los biólogos cuidadosos a 
los que les gusta pensar en los propios genes como 
jugadores emplean el término alelo para las formas 
posibles que un gen puede adoptar. No obstante, es 
común difuminar la distinción entre un jugador y un 
replicador de un modo muy similar a la forma en 
que a menudo se difumina la distinción entre un ju- 
gador y un tipo en la teoría de la información incom- 
pleta (véase «Información incompleta», Capítulo 6). 


Estabilidad evolutiva 


Para que la evolución funcione, debe haber cierta 


variación en la población. La mezcla de genes que 


tiene lugar durante la reproducción sexual es uns 
fuente de variación. Las migraciones geográficas y 
las mutaciones son otro. ¿Podemos esperar que un: 
población se estabilice frente a una variación aleato 
ria como ésta? Un enfoque consiste en buscar un: 
atractor asintótico, una población de replicadore: 
que se muestre estable ante cualquier perturbación 
de poca entidad. 

El modelo más simple posible sobre un proces: 
evolutivo biológico se llama «dinámica del replica 
dor». La Figura 14 muestra su funcionamiento el 
un juego concreto, cuando se toman jugadores d: 
dos poblaciones diferentes que evolucionan por s 
parado. En este capítulo, los diagramas correspon 
dientes son mucho más simples, porque la atenció» 
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se centra en juegos simétricos en los cuales los juga- 
dores se toman de una sola población. 

La dinámica del replicador supone que la propor- 
ción de una población que alberga un determinado 
replicador crece a un ritmo proporcional a dos fac- 
tores: 


°. La fracción de la población que en la actualidad 
alberga el replicador. 

° La diferencia entre la aptitud actual de los hués- 
pedes del replicador y la aptitud media de todos 
los huéspedes de la población. 


El primer requisito se limita a reconocer que la 
tasa de crecimiento de un replicador se encuentra li- 
mitada por el número de padres que pueden trans- 
mitir el replicador a la siguiente generación. El se- 
gundo requisito reconoce que la evolución sólo 
puede tener en cuenta la aptitud de un replicador 
respecto a la aptitud del conjunto de la población. 

Si todos los replicadores a considerar están pre- 
sentes cuando la dinámica del replicador se inicia, el 
sistema sólo puede converger en un equilibrio de 
Nash simétrico, si es que converge en algo. 


Estrategias evolutivas estables 


l.a idea de una estrategia evolutiva estable o EEE se 
inicia con George Price, que presentó un ensayo de 
60 páginas sobre matemática evolutiva en la revista 
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Nature, que, como cualquier autor más mundano 
habría sabido, sólo publica artículos cortos. Afortu- 
nadamente, su revisor era John Maynard Smith. 
Juntos escribieron un artículo que destilaba la esen- 
cia de la sabiduría de Price de una forma legible. 
Maynard Smith se puso a escribir Evolution and the 
Theory of Games, que hizo aparecer en el mapa la 
teoría de juegos evolutiva. George Price acabó por 
suicidarse, según se dijo, porque encontraba cada 
vez más difícil conciliar sus contribuciones funda- 
mentales a la biología evolutiva con sus conviccio- 
nes religiosas. 

Cuando se toman jugadores de poblaciones dife- 
rentes, las consideraciones a las que vamos a apelar 
no llevan a nada más exótico que un equilibrio de 
Nash estricto (en el cual no existen mejores respues- 
tas alternativas a las estrategias de equilibrio). Pero las 
estrategias evolutivas estables se aplican cuando los 
jugadores proceden de la misma población, y así se 
puede desarrollar un juego simétrico. Las propieda- 
des definitorias son: 


*- Una estrategia evolutiva estable (EEE) debe ser 
la mejor respuesta a sí misma. 

. Sila EEE no es la única respuesta óptima ante sı 
misma, debe ser una respuesta mejor respecto a 
cualquier alternativa de lo que la alternativa es 
para sí misma. 


El primer requisito establece que un par de estra 
tegias evolutivas estables debe constituir un refina 
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miento del concepto de equilibrio de Nash simétr)- 
co. Pero si éste fuera el único requisito, ¿qué evitaría 
una invasión desestabilizante de la población por 
parte de una respuesta óptima alternativa? El segun- 
do requisito proporciona la necesaria presión evolu- 
tiva contra una invasión como ésta, al exigir que una 
EEE sea más apta que un invasor inmediatamente 
después de la invasión. 

En un juego simétrico, cualquier EEF es necesa- 
riamente un atractor asintótico de la dinámica del 
replicador. A su vez, un atractor asintótico constitu- 
ye necesariamente un equilibrio de Nash simétrico. 
Por consiguiente, tenemos una condición necesaria 
y una condición suficiente para la estabilidad evolui- 
tiva. Ambas condiciones se aplican a una clase más 
amplia de procesos evolutivos que van más allá de 
las dinámicas de los replicadores, pero hay que ser 
un poco cuidadoso al aplicar el concepto de las EFE 
aun cuando se trate de dinámicas de este tipo. Por 
ejemplo, las trayectorias de la dinámica del replica- 
dor en Piedra-papel-tijera tienen una estructura ci- 
clica y el juego carece de FEE (véase «Descubrir 
estrategias maximin», Capítulo 2). Peor todavía, 
existen otros juegos simétricos 3 x 3 que tienen 
atractores asintóticos aislados que no son FEE. El 
concepto únicamente es cien por cien seguro en jue- 
gos simétricos con sólo dos estrategias puras. 

Sin embargo, criticar los defectos de los conceptos 
de modelización evolutiva a nivel abstracto no re- 
sulta demasiado productivo. La verdadera cuestión 
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es: ¿cuán útiles resultan para entender ejemplos bio- 
lógicos reales? 


El Juego del Halcón y la Paloma 


A veces dos pájaros procedentes de la misma especi 
compiten por un recurso valioso determinado. Los 
dos replicadores de la población hacen que sus hués 
pedes, ante esa situación, sean O pasivos o agresivos. 
Un pájaro pasivo le cede todo el recurso a un pájaro 
agresivo. Dos pájaros pasivos comparten el recurse 
equitativamente. Dos pájaros agresivos luchan. 

Maynard Smith se refería a los pájaros pasivo: 
como palomas, y a los agresivos, como halcones; d. 
ahí que se le llame «Juego del Halcón y la Paloma» 
Pero no hay que pensar erróneamente que los pája 
ros se consideran representantes de poblaciones dis 
tintas que evolucionan por separado. Se entiend: 
que el entorno es completamente simétrico. 


El Dilema del Prisionero 


Si la posesión de un recurso incrementa la aptitu 
de un pájaro en cuatro útiles y emprender una pele. 
en solamente uno, el Juego del Halcón y la Paloma sı 
reduce al Dilema del Prisionero que muestra la Fi 

gura 29. Cabe recordar que el único equilibrio d: 
Nash es que ambos jugadores jueguen halcón (véas: 
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Capítulo 1). Dado que se trata de una estrategia do- 
minante estricta, también constituye una estrategia 
evolutiva estable. 

Los pájaros que juegan al Juego del Halcón y la 
Paloma proceden de una misma población, y por lo 
tanto, la dinámica del replicador del Dilema del 
Prisionero de la Figura 29 es unidimensional (y no 
bidimensional como en ejemplos previos). Las fle- 
chas muestran que existe un único atractor asintó- 
tico en el cual la población está enteramente com- 
puesta de halcones. Si fuéramos a perturbar a esta 
población al introducir en ella una fracción signifi- 
cativa de mutantes de tipo paloma, a la larga todos 
ellos serían eliminados. De hecho, la cuenca de 
atracción consiste en todos los estados de la pobla- 
ción excepto aquel en el cual toda la población está 
compuesta de palomas. Por lo tanto, la aparición de 
una fracción de mutantes de tipo halcón, por pe- 
queña que sea, condena a las palomas a una extin- 
ción final. 


La falacia de la selección de grupo 


El ardor con el que los teóricos de los juegos niegan 
las diversas falacias que afirman que la cooperación 
es racional en el Dilema del Prisionero palidece has- 
ta lo insignificante cuando se compara con la feroci- 
dad casi diabólica con la que los biólogos evolutivos 
denuncian la falacia de la selección de grupo. 


Ui ñ sA mr 
¡E Lada SE Las LONA BREVE INTRODUCCION 


© De acuerdo con la falacia de la selección de grupo, 
la evolución favorece las mutaciones que refuer- 
zan la aptitud de las especies en lugar de la aptitud 
del propio gen mutado. Una población que juegue 
paloma en el Dilema del Prisionero sería por lo tanto 
invulnerable a una invasión por parte de un mutan- 
te halcón porque cualquier fracción de halcones en 
la población reduciría la aptitud total de ésta. La fa- 
lacia reside en situar erróneamente el replicador re- 
levante al nivel de las especies. Al fin y al cabo, es a 
nivel molecular donde físicamente tiene lugar la re- 
plicacion cuando se divide la doble hélice. Por consi- 
guiente, es correcto centrar la atención en la única 
EEE, que es halcón. 

Charles Darwin no sabia nada de la genética mo 
derna y, por lo tanto, a veces incurría en errores, en 
tre los que se encontraba la falacia de la selección 
de grupo. No obstante, el desafortunado objetivo dı 
las críticas contemporáneas es el biólogo Vero Wyn 
ne Edwards, quien sugirió, por ejemplo, que cuan 
do los estorninos se reúnen en grandes bandadas . 
anochecer lo hacen para estimar su número con | 
intención de controlar el tamaño de la població: 
La crítica de los argumentos de la selección de gr: 
po por parte de George Williams tuvo mucha 1: 
fluencia y provocó una explosión de títulos, de : 
que El gen egoísta, de Dawkins, no es más que i: 
ejemplo. 

El problema de la ratio entre sexos constituye uù 
bonito ejemplo del fracaso de la falacia de la sek 
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ción de grupo. ¿Qué ratio entre sexos favorecería a 
una especie nueva? La respuesta es que pocos ma- 
chos y muchas hembras. Entonces, ¿por qué tene- 
mos un número aproximadamente igual de chicos y 
chicas? Porque un chico que nazca en una población 
formada mayoritariamente por chicas será más 
fuerte que una chica; asimismo, una chica nacida en 
el seno de una población formada mayoritariamen- 
te por chicos será más fuerte que un chico. ¿Cómo se 
llega a un equilibrio en una situación como ésa? Éste 
es nuestro nuevo tema. 


Gallina 


Los valores de los pagos que identifican el Juego del 
Halcón y la Paloma con el Dilema del Prisionero no 
son realistas, porque es probable que el menor de los 
daños se convierta en un grave hándicap. Si asigna- 
mos una utilidad negativa a un pájaro que se pelea, 
sustrayéndole así dos útiles más de sus pagos, pasa- 
mos a la versión del Gallina de la Figura 29. 

El Juego del Gallina tiene tres equilibrios de Nash: 
dos puros y uno mixto. El equilibrio mixto requiere 
que cada jugador juegue paloma una tercera parte 
de las veces y halcón dos terceras partes del tiempo. 
Al contrario que en el apartado de «Alcanzar un 
equilibrio», en el Capítulo 2, rechazamos los equili- 
brios puros porque son asimétricos, ahora solamen- 
te nos resulta relevante el equilibrio mixto. 
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paloma paloma 


halcón halcón 
siempre siempre siempre dos tercios siempre 
paloma halcón paloma halcón halcón 
A E. e SEA E E, 
Dilema del Prisionero Juego del Gallina 


FIGURA 29. Dinámica del replicador en el Juego del Halcón y l.: 
Paloma. Para una sola población, pueden mostrarse las trayec 
torias empleando diagramas unidimensionales. Un diagram. 
similar para el Juego de la Caza del Ciervo mostraría las flecha: 
señalando en dirección contraria a este equilibrio mixto. 


¿Debemos entonces considerar a los pájaros 
como si tirásemos un dado? No en el Juego del Hal. 
cón y la Paloma. Para entender por qué, hay que 
imaginarse que un tercio de la población consiste en 
palomas y dos tercios en halcones. Cuando la natu 
raleza selecciona dos pájaros al azar entre esta poli 
morfa población para jugar al Gallina, a ambos ju 
gadores les parecerá que su oponente juega la 
estrategia del equilibrio mixto. Dado que los juga 
dores son indiferentes ante las estrategias puras que 
emplean en un equilibrio mixto (véase Capítulo 2), 
tanto halcones como palomas serán igual de aptos. 
Así que ningún pájaro necesita hacer nada aleatorio 
para que el equilibrio se sostenga. 


8. BIOLOGÍA EVOLUTIVA 199 


Maynard Smith observó que el estado de pobla- 
ción mixta no sólo se corresponde con un equilibrio 
de Nash simétrico, sino también con una estrategia 
evolutiva estable. La dinámica del replicador que 
muestra la Figura 29 confirma que una población 
con el doble de halcones que de palomas constituye 
un atractor asintótico. Es bueno ser halcón cuando 
hay muchas palomas, como es bueno ser paloma 
cuando hay muchos halcones. Los dos efectos se 
compensan entre sí en el equilibrio de Nash mixto, 
en el cual es indiferente que un jugador elija entre 
paloma o halcón. 

Hubo un tiempo en el que la supervivencia de dos 
variantes del mismo animal en un mismo entorno 
se consideraba un misterio. Seguramente un tipo 
debe de ser un poco menos apto que el otro, y por lo 
tanto, ¿será llevado a la extinción a largo plazo? Pero 
en estas situaciones la aptitud de una variante varía 
de acuerdo con su frecuencia. 


La perca de agallas azules 


La perca de agallas azules (Leoponis macrochirus) es 
un objetivo popular entre los pescadores de los lagos 
norteamericanos. El pez disfruta de una temporada 
reproductiva sincronizada en la cual los machos se- 
nalan nidos en el fondo de las orillas. Las hembras 
ponen sus huevos en el nido que les gusta más. Los 
huevos son rápidamente fertilizados por el macho 


200 LA TEORÍA DEJUEGOS. UNA BREVE INTRODUCCIÓN 


residente, que a partir de entonces protege con tena- 
cidad la descendencia resultante. 

Los machos guardianes comparten los lagos con 
otro tipo de macho, comúnmente llamado sneaker 
(«furtivo»). Los furtivos alcanzan la fase adulta en 
dos años, mientras que los guardianes necesitan sie- 
te. Los furtivos son incapaces de establecer y guardar 
un nido, ya que son poco más que Órganos sexuales 
autopropulsados. Cuando una hembra pone sus 
huevos en un nido, corren desde sus escondrijos 
para intentar fertilizar sus huevos antes que el guar- 
dián. 

En una generosa muestra de exuberancia, la natu 
raleza nos ha obsequiado con un furtivo alternativo 
que se disfraza de hembra, así como con un guar 
dián alternativo que sitúa su nido a cierta distancio 
de los nidos establecidos por los guardianes corrien 
tes, muy cercanos entre sí. 

La teoría indica que el número de cada tipo d: 
macho se ajustará para igualar su aptitud, una con 
clusión que concuerda tranquilizadoramente co, 
los datos. 


Jugar sobre el terreno 


Los animales no necesitan aleatoriedad cuand: 
compiten por parejas, pero en ocasiones se compo! 
tan como si así lo hicieran cuando «juegan sobre -~ 
terreno». 
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Las moscas macho del estiércol (Scatophaga sterco- 
raria) se congregan en boñigas de vaca con la espe- 
ranza de aparearse con hembras atraídas por el olor. 
¿Cuánto debería esperar un macho antes de buscar 
una boñiga fresca (lo que le lleva una media de cuatro 
minutos)? La teoría de juegos nos dice que busque- 
mos los equilibrios de Nash simétricos. En el modelo 
más simple, cada macho empleará una estrategia 
mixta en la cual se distribuye el tiempo de espera ex- 
ponencialmente. Es decir, su probabilidad de aban- 
donar una boñiga en este momento siempre es del 
doble de lo que esperaría si estuviera durante un pe- 
riodo de tiempo fijo. Pero ¿cuánto dura este periodo? 

Si la teoría tiene razón, el periodo debería ajustar- 
se hasta que el éxito del apareamiento de una mosca 
del estiércol fuera el mismo, independientemente de 
su periodo de espera. Como en el caso de las percas, 
los datos respaldan esta hipótesis en gran medida, 
aunque me atrevo a decir que una mosca del estiér- 
col no sería más receptiva que un ejecutivo de una 
empresa ante la idea de que estaba introduciendo 
activamente elementos aleatorios (véase «¿Tiene sen- 
tido hacer aleatorias las decisiones?», Capítulo 2). 


Selección por parentesco 
El reino animal está preñado de ejemplos de coope- 


ración intrafamiliar. Los perros cazadores africanos 
regurgitan la comida para ayudar a hermanos de 
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manada hambrientos. Los titís y los monos tamari- 
nos ayudan en el cuidado de sus sobrinos de familias 
extensas. Los machos de algunas especies de pájaros 
hacen lo mismo cuando sus posibilidades de repro- 
ducción en el año en curso son bajas. Los áfidos re- 
nuncian a su vida para defender a sus descendientes 
de un ataque. Los bueyes almizcleros forman un ani- 
llo defensivo alrededor de los miembros más débiles 
de la familia cuando les atacan los lobos. ¿Por qué es 
tan importante el parentesco en el reino animal? 


La regla de Hamilton 


El libro de Bill Hamilton Narrow Roads of Genelan:i 
versa sobre la vida y obra de otro genio estrambóti 
co, que ha fallecido recientemente de una típica 
muerte aventurera en un viaje de investigación de 
campo a Brasil. Hamilton se merece la mayor part 
del mérito de haber introducido la teoría de juego: 
en la biología, aunque dudo que oyera hablar siquie 
ra de John Nash durante los largos años en los que 
luchó, solo y sin reconocimiento, para crear un cam 
po completamente nuevo de investigación. Uno d: 
sus muchos logros consistió en formular la explica 
ción evolutiva de la cooperación dentro de la fami 
lia, conocida en la actualidad como «selección po: 
parentesco». 

Su argumento fue anticipado célebremente en un. 
broma medio seria de J. B. S. Haldane: cuando se |: 
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preguntaba si daría su vida por otro, contestaba que 
el sacrificio sólo valdría la pena si salvaba ¡a dos her- 
manos o a ocho primos! La broma de Haldane sólo 
es divertida si sabes que tu grado de relación con un 
hermano de padre y madre es de una mitad y tu gra- 
do de relación con un primo carnal es de un octavo. 

A veces se dice que el grado de relación familiar 
no es importante en realidad porque, en todo caso, 
los seres humanos comparten casi todos sus genes. 
Pero eso sería pasar por alto que nunca nos impor- 
tan los genes que siempre están presentes en el cuer- 
po humano, sino sólo una parte concreta del com- 
portamiento que será modificada o abandonada en 
función de si un gen recientemente mutado está 
presente o ausente. 

Tu grado de relación con un familiar es la probabi- 
lidad de que un gen recientemente mutado de tu 
cuerpo también se encuentre en el cuerpo de tu fa- 
miliar. Para ver qué grado de relación con un primo 
es un octavo, imagínate que tu prima es la hija de la 
hermana de tu madre. La probabilidad de que un gen 
mutante de tu cuerpo provenga de tu madre en lugar 
de provenir de tu padre es de una mitad. Si procedía 
de tu madre, la probabilidad de que también esté 
presente en el cuerpo de tu tía es de una mitad. Si está 
en el cuerpo de tu tía, la probabilidad de que se lo pa- 
sara a tu prima es de una mitad. Si multiplicamos es- 
tas tres mitades entre sí, el resultado es un octavo. 

Lo que cuenta al calcular la aptitud de un gen es la 
media del número de veces que es replicado en la ge- 
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neración siguiente. Pero no importa cuál de las dos 
o más versiones idénticas del gen se copie. Una copia 
del gen en el cuerpo de mi hermana es tan buena 
como una copia de un gen idéntico que esté dentro 
de mi propio cuerpo. Por lo tanto, cuando calcula- 
mos la aptitud de un gen de mi cuerpo, debemos te- 
ner en cuenta no solamente el efecto de mi compor- 
tamiento en mi propio éxito reproductivo, sino su 
efecto en el éxito reproductivo de mis familiares. 
Hamilton llamaba al resultado de dichos cálculos 
aptitud inclusiva. 

Si mi hermana es mi único familiar, un gen mu 
tante de mi cuerpo no debería limitarse a contar o! 
número extra de hijos que tendré de media a con 
secuencia de la modificación de mi comportamien 
to que ello comporta. Debería emplear la regla + 
Hamilton, que exige sumar el número de hijos ati! 
cionales que tendría mi hermana, ponderado po! !: 
mitad, porque ésta es la probabilidad de que el + 
también se encuentre en su cuerpo. Por ejemplo 
espero tener un hijo menos a consecuencia de 
cambio en mi comportamiento y mi herman. ' 
pera tener cuatro hijos más, la regla de Ham:!' : 
dicta que la aptitud inclusiva de mi nueva est! 0! 
gia es—1 + 1⁄2 x 4 = 1. Por consiguiente, mis p< ol 
das personales son superiores al beneficio de 1 
hermana. 

Las consecuencias de sustituir en un juego la 1; ' 
tud individual por la aptitud inclusiva puede 
dramáticas, como en el Dilema del Prisionero ' 
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FIGURA 30. Parientes juegan al Dilema del Prisionero. La regla 
de Hamilton se ha empleado para convertir las aptitudes indivi- 
duales del Dilema del Prisionero de la Figura 29 en aptitudes in- 
clusivas. Los gemelos idénticos ahora cooperarán. pero de sus 
hermanos debemos esperar comportamientos mixtos. 


Figura 30. Cuando los pajaritos compiten con sus 
hermanos por la comida, su comportamiento está 
genéticamente programado en gran medida. Si los 
pajaritos fueran gemelos idénticos, ambos jugadores 
podrían contar con que su oponente elige exacta 
mente la misma estrategia que ellos. La situación se 
reduce entonces a un juego de un solo jugador. 

Los juegos de dos participantes de la Figura 30 son 
más adecuados para modelizar el comportamiento 
humano en aquellos casos en los que el comporta- 
miento de los jugadores es aprendido más que gené- 
ticamente programado. Cuando Alice y Bob son ge- 
melos idénticos, se inicia un juego al que llamo «la 
Delicia del Prisionero» porque en este caso paloma es 
la estrategia dominante. Cuando son hermano y her- 
mana, nos llevan a una forma de Juego del Gallina en 
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la cual deberíamos esperar que sobrevivan juntas 
tanto actitudes de halcón como de paloma. Exami- 
nar el caso de hermanos cuyo comportamiento está 
determinado genéticamente —que resulta más intere- 
sante— nos apartaría demasiado del tema. 

El parentesco es especialmente importante en so- 
ciedades humanas primitivas. En las sociedades que 
permiten la promiscuidad, por ejemplo, algunas de 
las funciones que en nuestra sociedad lleva a cabo 
un padre las adopta el tío materno de un niño; la ra- 
zón subyacente es que todo el mundo sabe que su 
grado de relación con el niño es de un cuarto, mien- 
tras que nadie puede estar seguro de quién puede sen 
el verdadero padre del niño. La regla de Hamilton 
proporciona una explicación evolutiva de fenóme- 
nos como éste, ya que cuantifica el grado en que de 
beríamos esperar que «la sangre tire». 


Insectos sociales 


Una especie es eusocial si vive en colonias con gene 
raciones superpuestas, en las que uno o más indivi 
duos producen todos los descendientes y el resto sir 
ven de ayudantes estériles. La eusocialidad es rara, 
excepto entre los himenópteros, el orden de insectos 
que incluye a las hormigas, las abejas y las avispas. 
Antes se decía que la verdadera eusocialidad había 
evolucionado independientemente al menos doc: 
veces en los himenópteros, pero sólo dos en los de 
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más (los casos excepcionales son las termitas del or- 
den de los isópteros y las ratas topo lampiñas del 
orden Rodentia). Investigaciones posteriores han 
descubierto otras especies eusociales, la más intere- 
sante de las cuales es una gamba (Decapoda) que co- 
loniza esponjas en arrecifes de coral, pero la frecuen- 
cia de la eusocialidad en los himenópteros sigue 
siendo un enigma que requiere una explicación. 

¿Por qué generó la evolución trabajadores estérl- 
les? ¿Por qué trabajan incansablemente por los de- 
más? ¿Por qué se trata de un fenómeno común entre 
los himenópteros y raro entre las demás especies? 

A un determinado nivel, el rompecabezas es sen- 
cillo. Los grupos que trabajan juntos suelen ser más 
productivos que los individuos que actúan por sepa- 
rado. En una colmena o en un hormiguero, un gran 
número de trabajadores estériles se especializa en 
proteger a los jóvenes y cuidar de ellos, mientras que 
la reina se especializa en ser una máquina de poner 
huevos. A consecuencia de ello, el número total de 
nuevos miembros producidos es inmensamente 
mayor que si parejas de abejas u hormigas criaran 
familias separadas por sí mismas. 

Está claro por qué se beneficia la reina, pero ¿qué 
ganan con ello los trabajadores? Cada cría fértil 
que produce la reina está relacionada con los traba- 
jadores, son los hermanos y hermanas de los tra- 
bajadores. Un gen mutante que se expresa en el 
cuerpo de un trabajador tiene, por lo tanto, un 
montón de familiares que contar a la hora de calcu- 
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lar su aptitud inclusiva. lodos los descendientes fér- 
tiles de la reina, ponderados por su grado de relación 
con un trabajador, deben contarse al calcular el be- 
neticio que para un trabajador tiene esforzarse por 
ayudar a la reina. La productividad de una colmena 
o un hormiguero asegura que el balance resulte 
fuertemente favorable al lado de la eusocialidad. 

lodo ello sería igualmente verdadero para la espe- 
cie humana si tuviéramos un reparto de trabajado- 
res estériles, pero tradicionalmente criamos a nues- 
tros hijos en familias extensas en lugar de en fábricas 
biológicas. De modo que, ¿por qué la evolución no 
nos llevó por la misma senda que a los himenóp- 
teros? 

La respuesta de Bill Hamilton a esta pregunta de- 
pende de que los himenópteros sean haplodiploides, 
lo que significa que los huevos sin fertilizar se con- 
vierten en machos haploides y los huevos fertiliza- 
dos se convierten en hembras diploides. En las espe- 
cies haploides, cada locus de un cromosoma alberga 
sólo un gen. Los humanos son diploides, ya que cada 
locus alberga dos genes, uno de la madre y otro del 
padie. Es por ello por lo que el grado de relación en- 
tre dos hermanas humanas es de una mitad, dado 
que un hijo recibe un gen de cada padre en cada lo- 
cus, y el gen que recibe de cada padre tiene la misma 
probabilidad de ser cualquiera de los dos genes que 
el progenitor alberga en ese locus. Por el contrario, el 
grado de relación entre hermanas himenópteras es 
de tres cuartos, puesto que cada locus de sus cromo- 
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somas obtiene el mismo gen de su padre y un gen ob- 
tenido al azar del par aportado por su madre a ese 
locus. Por consiguiente, los trabajadores tienen una 
motivación más fuerte para ayudar a sus hermanas 
fértiles de la que tendrían los humanos en la misma 
situación. Pero éste no es el fin de la historia. 

Robert Trivers señaló que el grado de relación en- 
tre trabajadores genéticamente hembra y sus her- 
manos, los zánganos, es de sólo un cuarto. Si la ratio 
entre géneros de los himenópteros fuera de 50 con- 
tra 50, el grado de relación medio entre un trabaja- 
dor estéril y un hermano fértil solamente sería, por 
lo tanto, la media de tres cuartos y un cuarto, que es 
una mitad: la misma de nuestra propia especie. Sin 
embargo, en algunas especies de himenópteros, la 
ratio entre sexos es de cerca de 75 contra 25 a favor 
de las hembras fértiles (frente a los machos fértiles). 
¿Cómo es eso? La respuesta no solamente tiene inte- 
rés en sí misma, sino que también sirve para com- 
pletar la explicación de Hamilton de por qué la eu- 
socialidad se ha desarrollado tan frecuentemente 
entre los himenópteros. 

Entre los himenópteros, normalmente son los ge- 
nes expresados en los trabajadores lo que determina 
la ratio entre sexos, porque son los trabajadores los 
que sostienen a los jóvenes. La ratio entre géneros 
debe por lo tanto hacer al trabajador indiferente en- 
tre criar un nuevo macho fértil o una nueva hembra 
fértil. Esto sólo pasa cuando la ratio entre sexos es de 
75 contra 25, porque los pagos a un gen mutante ex- 
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presado en el cuerpo de un trabajador son entonces 
de 3⁄4 x Y4 por producir un macho, y de 1⁄4 x % por 
producir una hembra. Dado que los dos pagos son 
iguales, puede sobrevivir un equilibrio mixto en el 
cual las hembras nacen con una probabilidad de 
tres cuartos, y los machos, con una probabilidad 
de un cuarto. 

Con esta ratio entre sexos, el grado de relación 
medio que un trabajador tiene con un hermano o 
hermana fértil es de % x 3⁄4 + Ya x Ya, que suma ocho 
octavos. Si el trabajador fuera humano, el grado de 
relación sería de un medio. Por consiguiente, los tra- 
bajadores humanos tendrían que trabajar más duro 
por una reina humana para obtener los mismos be- 
neficios que un trabajador en un hormiguero o una 
colmena. 

Hay que subrayar que los detalles de esta historia 
abiertamente simple resultan controvertidos entre los 
biólogos. Incluso aquellas especies que más se acercan 
a esta historia se desvían de modos idiosincrásicos. 
Pero creo que el hecho de que la teoría de juegos per- 
mita a los biólogos evolutivos explicar las ratios entre 
géneros en especies para las que no son simétricas 
constituye una de las demostraciones más convincen- 
tes de que debemos de estar haciendo algo bien. 

Quedan muchos misterios, por supuesto. ¿Por 
qué los himenópteros son haplodiploides? ¿Cómo 
es que algunas especies de este orden son eusociales? 
¿Qué hay de las colonias con múltiples reinas? ¿Qué 
hay de la Pachycondyla villosa, especie en la que rei- 
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nas sin parentesco aparentemente fundan colonias 
juntas? ¿Qué hay de los múltiples enigmas que plan- 
tean las termitas? Los creacionistas se valen de este 
reconocimiento de ignorancia para desacreditar a 
la biología evolutiva, pero creo que estas críticas 
simplemente revelan la incapacidad para entender 
cómo funciona la ciencia. 


La evolución de la cooperación 


Ya sabemos que la cooperación puede sostenerse en- 
tre animales que no se encuentran relacionados por 
los mecanismos a los que Bob Trivers llamó «altruis- 
mo recíproco». Un ejemplo maravilloso lo ofrece el 
murciélago vampiro (Desmodus rotundis). 

Los murciélagos vampiro duermen juntos colga- 
dos en cuevas durante el día, y por la noche buscan 
un animal al que chuparle la sangre. Cerca de un 8% 
tiene éxito, lo que representa un gran problema para 
los murciélagos, que necesitan alimento cada 60 ho- 
ras aproximadamente. Por esta razón, la presión 
evolutiva a favor de compartir es muy fuerte. Gerald 
Wilkinson descubrió que los murciélagos vampiro 
comparten sangre de un modo recíproco con com- 
pañeros de cueva que no siempre son familiares su- 
yos. En resumen, es más probable que un vampiro 
regurgite sangre para un compañero de cueva supli- 
cante si dicho compañero ha compartido sangre con 
él en el pasado. 
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FIGURA 31. Murciélago vampiro. 


¿Cómo puede ponerse en marcha una coopera- 
ción como ésta? Axelrod ha enturbiado las aguas al 
afirmar que había demostrado que el Toma y daca es 
una EEE en el Dilema del Prisionero repetido indefi- 
nidamente. Aunque Maynard Smith respaldó equi- 
vocadamente la declaración, resulta obvio que no es 
cierta. Una población de Toma y dacas puede ser in- 
vadida por una estrategia que siempre juegue palo- 
ma. Ese mutante no desplazaría al Toma y daca, pero 
tampoco sería expulsado. 

No hay estrategia pura que pueda constituir una 
EEE en el Dilema del Prisionero repetido indefinida- 
mente: una mutación que cambie la estrategia en un 
subjuego no alcanzado nunca será detectada, por no 
decir eliminada. El concepto de EFF debe ser amplia- 
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do para resultar útil en un contexto como ése, de 
modo que todos los conjuntos de estrategias a través 
de las cuales una población puede transitar se consi- 
deren agregados evolutivos estables. Por ejemplo, el 
conjunto N tanto en la Figura 14 como en la Figu- 
ra 32 es un tipo de atractor asintótico agregado, den- 
tro del cual el sistema es libre de variar de una estra- 
tegia a otra (no es necesario que haya una trayectoria 
que aleje de N, como en ambos casos). 


El Juego del Halcón, la Paloma y el Vengador 


El problema ya se hace evidente en el Juego del Hal- 
cón, la Paloma y el Vengador con el cual Maynard 
Smith y Price analizaron originariamente la evolu- 
ción de la cooperación. Un vengador juega como 
un halcón contra un halcón y como una paloma 
contra una paloma. La estrategia venganza está dé- 
bilmente dominada, de modo que el juego tiene un 
equilibrio de Nash simétrico en el cual la venganza 
nunca se juega. Como en el Juego del Halcón y la 
Paloma, paloma se juega con probabilidad 1/3 y hal- 
cón con probabilidad 2/3. En el triángulo superior 
de la Figura 32, este equilibrio mixto se marca con 
la letra M. También hay una infinidad de equilibrios 
de Nash en los cuales nunca se juega halcón, marca- 
dos en la Figura 32 con la letra N. Éstos requieren 
que venganza se juegue con una probabilidad de al 
menos 3/5. 
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FIGURA 32. Juego del Halcón, la Paloma y el Vengador. El trián- 
gulo superior muestra la dinámica del replicador en el juego 
puro. Una mezcla de población se considera distribuida según 
las tres esquinas del triángulo. El punto que lo representa está si- 
tuado en el centro de gravedad de esta distribución. El triángulo 
inferior muestra la dinámica del replicador cuando los venga- 
dores cuentan con una ligera ventaja frente a las palomas, y los 
halcones, una ligera ventaja sobre los vengadores. 


El triángulo superior muestra las dinámicas del 
replicador del Juego del Halcón, la Paloma y el Ven- 
gador. El conjunto sombreado es la cuenca de atrac- 
ción del conjunto N. Maynard Smith y Price pasan 
por alto este conjunto porque sólo M constituye una 
EEE. No obstante, si el sistema encontrara la forma 
de llegar a N, su única oportunidad de escapar es 
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que aparezca una nueva mutación halcón cuando 
esté cerca de Q. Pero este improbable acontecimien- 
to podría demorarse mucho tiempo. De hecho, han 
tenido lugar periodos extremadamente largos de es- 
tabilidad en la evolución de muchas especies que 
podrían atribuirse a esta causa. 

El triángulo inferior de la Figura 32 muestra la di- 
námica del replicador de una versión modificada del 
Juego del Halcón, la Paloma y el Vengador, en la cual 
se supone con realismo que el vengador sale un poco 
mejor parado ante una paloma y un poco peor para- 
do ante un halcón. Este juego tiene tres equilibrios 
de Nash simétricos: uno es análogo al equilibrio M 
del Juego del Halcón y la Paloma; otro es un equili- 
brio puro R en el que sólo se juega venganza; y el ter- 
cero, un equilibrio P en el cual las tres estrategias se 
juegan con una probabilidad positiva. Los equili- 
brios M y R corresponden a estrategias EEE. 

La cuenca de atracción de R se muestra sombrea- 
da en la Figura 32. Dado que se trata de un conjunto 
amplio, tenemos un modelo básico en el que tiene 
sentido aplicar el concepto de EEE y que ofrece el 
punto de partida de una explicación de la evolución 
de la cooperación. Maynard Smith y Price expanden 
el modelo mediante la introducción de un tipo bra- 
vucón que se muestra como un vengador, pero que 
ante un desafío cede. Los bravucones desplazan a las 
palomas, pero, por lo demás, poco cambia. 

No obstante, la aplicación más interesante del 
Juego del Halcón, la Paloma y el Vengador se reali- 
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za sobre el caso de la interacción local. En la vida 
real, los animales juegan mayoritariamente a juegos 
con los que geográficamente les son vecinos. Por lo 
tanto, el azar puede fácilmente arreglárselas para 
que un vengador mutante llegue a ser numeroso en 
un vecindario pequeño. Entonces, el Juego del Hal- 
cón, la Paloma y el Vengador nos indica que el resto 
de estrategias se extinguirá gradualmente en ese ve- 
cindario. Y a continuación pasará lo mismo con 
vecindarios que se superpongan hasta que todo el 
medio sea tomado por vengadores. 

Ésta me parece la mejor explicación de la evolu- 
ción de la cooperación mediante un modelo básico 
que se propone comúnmente. 


Evolución social o cultural 


A veces se piensa que sólo debería hablarse de evolu- 
ción si la analogía con la evolución biológica es muy 
cercana. La verdad es que los replicadores no sola- 
mente surgen en un contexto biológico. 

Las reglas generales, los códigos de conducta, las 
modas, los estilos de vida, los credos y las ideas cien- 
tíficas son siempre replicadores de un tipo u otro. Ri- 
chard Dawkins se refiere a dichos replicadores cultu- 
rales como «memes», los cuales se extienden de una 
mente humana a otra por imitación o educación. 

Solía mostrarme entusiasta respecto a los me- 
mes, pero ahora que entendemos que la dinámica 
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del replicador no sólo emerge en modelos básicos 
de reproducción biológica, sino también en mode- 
los básicos de aprendizaje por imitación y estímulo- 
respuesta, parece innecesario que nos encadenemos 
al paradigma de los memes. Cuando las dinámicas 
adaptativas nos llevan al equilibrio de Nash de un 
juego, estoy dispuesto a hablar de evolución cultu- 
ral. 

Podría parecer que la principal diferencia en la 
aplicación de dinámicas evolutivas entre la biología 
y las ciencias sociales es que los biólogos normal- 
mente están muy bien informados sobre las fuentes 
de variaciones interesantes, mientras que los cientí- 
ficos sociales sólo pueden intentar adivinar. Por 
ejemplo, un modelo evolutivo de economía debe te- 
ner en cuenta el hecho de que las mutaciones en for- 
ma de nuevos planes para ganar dinero aparecen 
todo el tiempo; ahora bien, si los economistas pu- 
dieran predecir cuál de ellos iba a tener éxito, ¡serían 
todos ricos! 


9. Negociación y coaliciones 


La mitad de Teoría de Juegos y comportamiento eco 

nómico, de Von Neumann y Morgenstern, está dedi- 
cada a juegos de suma cero con dos jugadores. En 
esa parte del libro es donde nace la teoría de juegos 
no cooperativa que hemos estudiado hasta ahora. En 
esta teoría, las oportunidades estratégicas de los ju- 
gadores se exploran en detalle y se hacen prediccio- 
nes sobre su comportamiento empleando la idea de! 
equilibrio de Nash. La otra mitad del libro de Von 
Neumann y Morgenstern trata de la teoría de juegos 
cooperativa. 

El uso de las palabras es una fuente interminable 
de confusión, porque los críticos suponen equivoca- 
damente que la teoría de juegos no cooperativa trata 
exclusivamente del conflicto, mientras que la teoría 
de juegos cooperativa trata exclusivamente de la co- 
operación. Tienen razón en la medida en que la teo- 
ría de juegos cooperativa se centra en buena parte en 
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cómo unos individuos racionales cooperarán, ¿qué 
coaliciones se formarán?, ¿qué parte del pastel con- 
seguirá cada uno? Pero se equivocan cuando tratan 
la teoría de juegos cooperativa y no cooperativa 
como perspectivas antitéticas en las que el Doctor 
Jeckyll y Mr. Hyde se erigen como paradigmas en- 
frentados sobre la condición humana. Después de 
todo, el Teorema Popular forma parte de la teoría 
de juegos no cooperativa, pero su principal interés 
radica en mostrar de qué modo puede sostenerse la 
cooperación como comportamiento de equilibrio 
en juegos repetidos. 

La teoría de juegos cooperativa sólo difiere de la 
teoría de juegos no cooperativa en que abandona 
cualquier pretensión de explicar por qué la coopera- 
ción sobrevive en nuestra especie. En lugar de ello, 
propone que los jugadores tengan acceso a una «caja 
negra» que no es objeto de un modelo, y cuyos con- 
tenidos de algún modo resuelven todos los proble- 
mas de compromiso y confianza que nos han preo- 
cupado periódicamente a lo largo de este libro. Entre 
otras cosas, esta caja negra debe contener una expli- 
cación de cómo las negociaciones previas al juego 
relativas a de qué manera debe jugarse éste pueden 
resultar en un acuerdo que los jugadores traten 
como un compromiso incondicional. 

En las aplicaciones económicas a veces puede ar- 
gumentarse que la caja negra contiene todo el apa- 
rato del sistema legal y que, por tanto, los jugadores 
respetan los contratos por miedo a una demanda ju- 
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dicial si no lo hacen. En las aplicaciones sociales, la 
caja negra puede contener las razones por las cuales 
los jugadores se preocupan por el efecto que un 
comportamiento deshonesto en el presente puede 
tener en el futuro sobre su reputación de comporta 
miento fiable. Incluso puede argumentarse que la 
caja negra contiene el resultado del condiciona- 
miento de nuestra niñez o una aversión instintiva al 
comportamiento inmoral. 

La falacia utópica consiste en imaginar que la caja 
negra de la teoría de juegos cooperativa no contiene 
nada más que la fervorosa esperanza de que el con- 
flicto desaparecería sólo con que la gente se compor- 
tara racionalmente. Hay que reconocer que en la 
vida real gran parte del conflicto es estúpido, pero no 
haremos que la gente sea menos estúpida enseñán- 
dole que su corazón es más racional que su cabeza. 

La forma de responder a la falacia utópica consis- 
te en abrir la caja negra cooperativa y dedicarle una 
mirada larga e inquisitiva a lo que tiene dentro. 
¿Cómo se explica que los jugadores confíen el uno 
en el otro en algunas situaciones y no en otras? ¿Por 
qué no lucha cada uno por sus propios intereses en 
lugar de hacerlo por los del grupo al que pertenece? 

Cuando se busca una respuesta a estas preguntas, 
no hay otra alternativa que emplear los métodos de 
la teoría de juegos no cooperativa. Por lo tanto, la 
teoría de juegos no cooperativa consiste en el estu- 
dio de juegos en los cuales cualquier cooperación 
que pueda surgir queda completamente explicada 
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por la elección de estrategias hecha por los jugado- 
res. Pero esto puede resultar muy duro. La teoría de 
juegos cooperativa esquiva todas las difíciles pre- 
guntas de por qué con la esperanza de encontrar ca- 
racterizaciones simples de qué acuerdos alcanzarán 
finalmente los jugadores racionales. 


El programa Nash 


El programa Nash nos invita a abrir la caja negra co- 
operativa para analizar si el mecanismo que alberga 
funciona realmente del modo que supone un deter- 
minado concepto de solución cooperativa. 

Nash observó que cualquier negociación es, en sí 
misma, una especie de juego en el cual los movi- 
mientos son todo lo que los jugadores puedan decir 
o hacer durante el proceso. 51 modelizamos de esta 
manera cualquier negociación que precede al desa- 
rrollo de un juego, el resultado es un juego amplia- 
do. Una estrategia para este juego de la negociación 
le dice primero a un jugador cómo conducir las ne- 
gociaciones previas al juego y a continuación cómo 
jugar al juego en sí con arreglo al resultado de las ne- 
goclaciones. 

Los juegos de negociación deben estudiarse sin 
presuponer una negociación previa al juego, pues 
toda actividad previa ya ha sido integrada en sus re- 
glas. Analizarlos es pues una tarea para la teoría de 
juegos no cooperativa. De modo que buscamos sus 
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equilibrios de Nash con la esperanza de que el pro- 
blema de selección de equilibrios no resulte dema- 
siado dificultoso. 

Cuando los juegos de negociación pueden resol- 
verse con éxito, tenemos una forma de investigar la 
teoría de juegos cooperativa. Si un concepto coo- 
perativo de solución predice el resultado de un 
acuerdo racional sobre cómo jugar un determina- 
do juego, un análisis no cooperativo del juego de la 
negociación ampliado tendría que ofrecer la mis- 
ma respuesta. 

Por consiguiente, Nash consideraba las teorías 
cooperativa y no cooperativa de los juegos como 
maneras complementarias de afrontar el mismo 
problema. La teoría de juegos cooperativa ofrece 
predicciones sobre acuerdos racionales que resultan 
fáciles de aplicar. La teoría de juegos no cooperativa 
proporciona un modo de poner a prueba dichas 
predicciones. 


La solución negociadora de Nash 


Una mansión en Beverly Hills vale 4 millones de dó- 
lares para sus propietarios y 5 millones de dólares 
para un comprador potencial. Al reunirse y negociar 
su venta, el comprador y el vendedor pueden crear 
un excedente de 1 millón de dólares; cómo se repar- 
te el excedente entre ellos se decide por negociación. 
Un modelo simple que captura la esencia de este ar- 
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quetípico problema de negociación se conoce tradi- 
cionalmente como «Divide el dólar». 

La historia que acompaña al modelo presenta a 
un filántropo que ofrece a Alice y Bob la oportuni- 
dad de repartirse un dólar con la condición de que 
puedan acordar una forma de dividirlo entre los 
dos. Si no pueden llegar a un acuerdo, el filántropo 
se quedará su dólar. En esta historia, el dólar repre- 
senta el excedente que negocian los dos agentes eco- 
nómicos. La condición del filántropo que establece 
que sólo podrán disponer del dólar si Alice y Bob 
pueden llegar a un acuerdo representa el hecho de 
que no habrá excedente a menos que los agentes se 
junten para crearlo. 

Cuando Nash analizó el problema, los economis- 
tas ortodoxos sostenían que la racionalidad es irre- 
levante para el tema, ya que el resultado depende de 
lo hábilmente que negocien Alice y Bob. Por lo tan- 
to, la negociación se consideraba un problema de 
psicología más que de economía. Incluso Von Neu- 
mann y Morgenstern respaldaron este punto de vis- 
ta en su libro Teoría de Juegos y comportamiento eco- 
nómico. Cuando se hablaba sobre negociaciones 
treinta años más tarde, descubrí que a los que inte- 
rrumpen en las conferencias les sigue entusiasman- 
do la idea de que «la negociación no forma parte de 
la economía». Mirando atrás, parece sorprendente 
que una noción tan rara haya cosechado una acepta- 
ción tan extendida, pero el pasado es realmente un 
país extraño. 
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El argumento de Nash 


John Nash empezó a reflexionar sobre la negocia 
ción cuando se matriculó en un único curso de eco- 
nomía sobre comercio internacional como parte de 
sus estudios de licenciatura. El resultado de sus refle- 
xiones acabó por desmontar la visión ortodoxa que 
establece que el problema de la negociación es inde- 
terminado. 

Hay que recordar que podemos identificar la utili 
dad con dinero en el caso de un jugador neutral al 
riesgo. Si Alice y Bob son neutrales al riesgo en el jue- 
go de Divide el dólar, no hay que ser un genio para 
predecir que dividirán el dólar en dos fracciones 
iguales si ambos tuvieran acceso a las mismas opor 
tunidades estratégicas en el juego de negociación al 
que jueguen. Pero ¿qué pasaría si tuvieran diferentes 
actitudes hacia el riesgo? Si Bob es más averso al ries- 
go que Alice, tendrá más miedo al desacuerdo que 
ella, así que acabará con una fracción más pequeña 
del dólar. Más pequeña, sí, pero ¿cuánto? 

La forma de Nash de descubrir la respuesta se 
ilustra en la Figura 33. El primer paso consiste en 
identificar cada posible acuerdo con la pareja de uti 
lidades que Alice y Bob conseguirían si se imple 
mentara el acuerdo. El punto de desacuerdo resul- 
tante de que no se alcance un acuerdo se llama statu 
quo. La forma del conjunto de todos los acuerdos 
posibles es convexa cuando tanto Alice como Bob 
son aversos al riesgo. 
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FIGURA 33. Solución negociadora de Nash. 


Nash supone que un acuerdo racional se encon- 
trará en algún punto de la frontera del conjunto de 
todos los acuerdos posibles, pues de otro modo los 
jugadores podrían encontrar un acuerdo más efi- 
ciente que ambos preferirían (misteriosamente, los 
economistas denominan a esta observación «teore- 
ma de Coase», aunque ni es un teorema ni es obra 
del ganador del Premio Nobel Ronald Coase). A 
partir de ahí, Nash dibujó una tangente en la fronte- 
ra del conjunto de acuerdos en el punto que repre- 
senta el acuerdo racional. 

El siguiente paso consiste en resituar los ceros en 
las escalas de utilidad de Alice y Bob en el statu quo. 
A continuación, las unidades de sus escalas de utili- 
dad se ajustan para hacer que la pendiente de la tan- 
gente en el acuerdo racional equivalga a 45°. El dia- 
grama a la derecha de la Figura 33 muestra la nueva 
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situación. Si el conjunto de acuerdos fuera el trián- 
gulo sombreado de este diagrama, el acuerdo racio- 
nal debería ser el punto central de la hipotenusa 
(por la misma razón por la que acordamos que el 
acuerdo racional sería de 50-50 en el Juego de Divi- 
de el dólar si tanto Alice como Bob son neutrales al 
riesgo). 

El último paso consiste en argumentar que el 
acuerdo racional debe permanecer inalterado cuan- 
do retiramos todos los puntos del triángulo som- 
breado de la derecha de la Figura 33 que no se 
encuentran en el conjunto de acuerdos de color 
sombreado oscuro. Nash las llamaba «alternativas 
irrelevantes» porque ni Alice ni Bob elegían una de 
ellas cuando estaban disponibles y, por lo tanto, no 
tienen razón alguna para cambiar el acuerdo cuan- 
do dejan de encontrarse disponibles. 

Por lo tanto, para encontrar la solución negocia- 
dora de Nash en el diagrama de la izquierda de la Fi 
gura 33, sólo nos hace falta localizar la tangente que 


toca el punto central de la frontera del conjunto de 
acuerdos. 


¿Qué parte de las tareas del hogar debería hacer 
cada uno? 


A los periódicos les gusta echar leña el fuego en la 
guerra de sexos cuando las cifras de ventas andan 
mal. Ésta es una cita típica: «Los hombres dicen res- 
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petar la igualdad de derechos en el hogar, mientras 
dejan que las mujeres realicen tres cuartas partes de 
las tareas domésticas». A igualdad del resto de con- 
diciones, el hecho de que las mujeres hagan más ta- 
reas domésticas que sus maridos realmente mostra- 
ría que el equilibrio de poder en los matrimonios se 
encuentra sesgado a favor de los hombres; pero, ¿son 
iguales el resto de las condiciones? 

Alice y Bob se casan. No están interesados en dis- 
frutar otro beneficio del matrimonio que el de 
compartir las tareas domésticas. Al estilo moderno, 
acuerdan un contrato matrimonial que especifica 
cuántas horas de trabajo doméstico aportará cada 
uno a la semana. ¿Qué acuerdo predecirá la solu- 
ción negociadora de Nash? 

En la versión básica del problema, Alice conside- 
ra que en un hogar deben dedicarse dos horas dia- 
rias a tareas domésticas; Bob cree que una hora al 
día es adecuada. Cada jugador obtiene un beneficio 
de 100 útiles a la semana si como mínimo se llevan a 
cabo las horas de trabajo doméstico que consideran 
apropiadas; por debajo de su mínimo, no obtienen 
beneficio alguno de ninguna tarea doméstica. 

Ni a Alice ni a Bob les gusta realizar tareas domés- 
ticas. Alice pierde 5 útiles a la semana por cada hora 
que dedica a las tareas domésticas. Bob pierde 10 
útiles por hora, porque le desagrada hacer tareas del 
hogar más que a Alice. Por lo tanto, en la situación 
de statu quo previa al matrimonio, Alice hacía 14 
horas de trabajo doméstico a la semana, del que ob- 
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tenía una utilidad de 30 útiles; Bob dedicaba 7 horas 
a las tareas domésticas, que también le proporciona- 
ban una utilidad de 30 útiles. 

El teorema de Coase establece que el resultado del 
acuerdo será eficiente, lo que significa que Alice se 
saldrá con la suya en cuanto al número de horas que 
deben dedicarse a las tareas domésticas en el nuevo 
hogar. Para hallar la solución negociadora de Nash, 
debemos encontrar los resultados extremos que ha- 
cen que el matrimonio valga la pena para ambos 
cónyuges. Un extremo consiste en que Alice haga 
todo el trabajo doméstico; entonces conseguirá 30 
útiles y Bob 100 útiles. El otro extremo se da cuando 
es Bob el que sólo consigue 30 útiles; en ese caso 
efectúa una hora de trabajo al día. Alice debe hacer 
otra hora de trabajo para completar las dos horas 
diarias que considera necesarias. En tal caso, la utili 
dad de ella asciende hasta 65 útiles. 

Como el modelo se ha diseñado de modo que Ali 
ce y Bob sean neutrales al riesgo, la solución nego- 
ciadora de Nash se encuentra en la media de los dos 
extremos. Así que cada semana Alice acabará con 
47,5 útiles y Bob con 65 útiles. Para que esto suceda. 
Alice tendrá que trabajar 10,5 horas a la semana y 
Bob sólo 3,5 horas a la semana. 

Por consiguiente, la solución negociadora du 
Nash establece que si Alice y Bob negocian sobre 
una base equitativa, Alice se saldrá con la suya en 
cuanto al número de horas de trabajo doméstico 
que se realizan a la semana, pero tendrá que hacer 
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tres cuartas partes del trabajo. Si en la realidad es 
cierto que las casadas hacen el triple de trabajo do- 
méstico que las solteras, nuestro modelo básico de- 
muestra que ello no significa necesariamente que el 
equilibrio de poder en los matrimonios esté sesgado 
a favor de los hombres. ¿Cuántas horas dedicaría 
cada uno a las tareas domésticas si todos los factores 
excluidos del modelo básico se tuvieran en cuenta! 
Aunque lo supiera, ¡no lo diría! 


El modelo de negociación de Rubinstein 


De acuerdo con su programa, Nash defendía su so- 
lución negociadora con un modelo de negociación 
no cooperativa en el cual Alice y Bob se comprome- 
ten simultáneamente con demandas de «lo temas o 
lo dejas». No obstante, Schelling posteriormente 
pudo poner en duda con éxito el realismo de atri- 
buir capacidad de compromiso a los jugadores en 
juegos de negociación. 

Por ejemplo, si Bob pudiera ser más rápido que 
Alice al realizar un compromiso irrevocable en el 
Juego de Divide el dólar, podría llevarse todo el bote 
pidiendo 99 centavos, lo que dejaría a Alice en la 
disyuntiva de elegir entre un penique o nada. Pero 
¿cómo puede convencer Bob a Alice de que se en- 
cuentra totalmente comprometido con su decisión 
y de que nada de lo que ella pudiera hacer podría ha- 
cerle cambiar su petición? ¿Quién cree a alguien que 
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afirma que ahora está haciendo su «oferta última y 
definitiva»? Incluso los precios anunciados en obje- 
tos caros de tiendas de moda raramente son finales. 
El vendedor intentará que te sientas como un avari- 
cioso por pelear por un mejor precio, pero por una 
vez la sabiduría popular tiene razón. Todo es nego- 
ciable. Nunca aceptes un no como respuesta. 

Establecer compromisos es verdaderamente difí- 
cil. A veces la gente se forja una carrera a base de 
construirse una reputación de persona obstinada o 
estúpida a este respecto. Ocasionalmente, los sindi 
calistas son capaces de comprometerse mediante el 
voto a líderes mtransigentes, pero, aparte de cir 
cunstancias especiales, el vocabulario del compro 
miso a menudo 0 es más que parloteo barato. Ni 
obstante, si todas las amenazas fueran creíbles, hi 
mos aprendido que debemos buscar los equilibrio 
de perfección en el subjuego. 

Por tanto, ¿qué pasa cuando cualquier cosa qu: 
diga un jugador deba ser creíble antes de que el ot». 
Jugador la crea? Esta pregunta llevó a Ariel Rubins 
tein a hacer la más importante de todas las cont: : 
buciones al programa Nash. En el modelo no co 
perativo de negociación más natural, Alice y Bu 
alternan en la presentación de ofertas del uno al ot: 
hasta que alcanzan un acuerdo. Si se supone qu 
prefieren llegar a un acuerdo determinado ahora «. 
lugar de más tarde, Rubinstein demostró que el mu 
delo de valoración de opciones tiene un único equ 
librio de perfección en el subjuego. 


ren 


9. NEGOCIACIÓN Y COALICIONES 23 


Mi propia contribución consistió en demostrar 
que el único resultado que constituye un equilibrio 
de perfección en el subjuego se aproxima a una ver- 
sión asimétrica de la solución negociadora de Nash 
cuando el intervalo de tiempo entre las sucesivas 
ofertas es lo suficientemente pequeño. En la versión 
simétrica de la solución negociadora de Nash, la re- 
lación NB/AN de la Figura 33 es igual a 1. En la ver- 
sión asimétrica, NB/AN es igual a la relación entre 
las tasas de descuento de Alice y Bob por el paso del 
tiempo. 

Si hacemos que Alice sea más paciente que Bob, la 
tasa de descuento de ella decrecerá y, por consi- 
guiente, la versión asimétrica de la solución negocia- 
dora de Nash predice que conseguirá una parte ma- 
yor del excedente a dividir. 


¿Qué es lo importante al negociar? 


Cuando conocí a Ariel Rubinstein, me contó que ha- 
bía estado trabajando sin éxito en el problema de la 
negociación. Dado que su teorema demostró tener un 
papel central en la destrucción de la ortodoxia según 
la cual el problema de la negociación es indetermina- 
do, su comentario se basaba en un juicio excesivamen- 
te humilde. Pero las razones por las que se juzgaba tan 
duramente a sí mismo continúan existiendo. 

Todo el trabajo sobre negociaciones que se ha re- 
sumido hasta este momento supone que la informa- 
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ción es completa. Sin embargo, ¿con qué frecuencia 
los negociadores reales conocen las preferencias dei 
otro? 

Cuando Alice intenta venderle una casa a Bob, k 
gustaría saber la cantidad máxima que éste estaria 
dispuesto a pagar, pero Bob no se la comunicará. 
Tampoco le dirá ella cuál es el precio mínimo que 
está dispuesta a aceptar. Dichas asimetrías en la in 
formación tienen una relevancia capital; en concre- 
to, el teorema de Coase no funciona. Roger Myerson 
ha demostrado que si todos conocen que las valora. 
ciones de Alice y Bob son independientes y tiener 
una probabilidad igual de encontrarse en cualquic: 
punto entre los 4 y los 5 millones de dólares, el resul 
tado de la negociación óptima es, en realidad, mur 
ineficiente, Aun cuando se elige el proceso de nego 
ciación para maximizar el excedente esperado que 
puedan lograr los negociadores racionales, ¡la cas. 
sólo se vende cuando para Bob vale 250.000 dólare- 
más que para Alice! 

La información se impone a todos los demás cri 
terios, pero nadie sabe de qué manera se puede ob 
tener una sola predicción del modelo de la negocia 
ción de Rubinstein cuando la información es 
incompleta. Por lo tanto, los principios siguientes 
solamente gozan de fundamentos sólidos cuando 
los negociadores se muestran incapaces de ocultars« 
secretos el uno al otro. 
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Compromiso 


A Alice le conviene convencer a Bob de que no pue- 
de aceptar menos de lo que está pidiendo, pero de- 
bería considerar cualquier intento de éste de expre- 
sar un compromiso similar con gran escepticismo. 
Algunas veces, incluso, tu oponente se revelará 
como un pusilánime. Por ejemplo, en una ocasión, 
cuando le pregunté a la empleada de un alquiler de 
coches qué descuentos se ofrecían sobre el precio 
que acababa de presentarme, me contestó: un 20%, 


Riesgo 


Las actitudes de los jugadores ante la toma de riesgos 
determinan la forma del conjunto de acuerdos. 
Cuanta mayor es tu aversión al riesgo, menos consi- 
gues. Los vendedores de coches usados fingen una li- 
gera despreocupación ante la perspectiva de perder 
una venta. Pero, como dice la Biblia, «aunque digan 
que no es nada, cuando se vayan, se jactan de ello». 


Tiempo 


La paciencia relativa de los jugadores determina 
cuánta asimetría debe introducirse en la solución 
negociadora de Nash. Cuanto más impaciente seas, 
menos consigues. En un reciente caso judicial en el 
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que estuve implicado, el regulador del mercado de 
las telecomunicaciones había ordenado que la em- 
presa líder en telefonía fija tenía que negociar con un 
nuevo competidor entrante por el precio que carga- 
ría por conectar a los clientes del competidor en- 
trante con sus propios clientes. Pero en ausencia de 
una orden sobre cuándo debía ponerse en práctica el 
acuerdo, la empresa de telefonía fija podía permitir- 
se tener una paciencia infinita y, de esa manera, 
apropiarse de todos los beneficios del sector. 


¿Jugar limpio? 


Un best seller sobre negociación despreció el uso de 
estrategias, a las que tildaba de trampas. Simple 
mente debería insistirse en lo que es justo. ¡Quizás 
sea ésta la razón por la que un estudio sobre la nego 
ciación salarial colectiva en Suecia presentó 24 defi 
niciones de lo que se considera justo! 

Ciertamente, la reputación de ser obstinado po! 
razones religiosas o ideológicas puede a veces resul 
tar útil a la hora de negociar. Por ejemplo, en El per 
fecto comerciante inglés, Daniel Defoe explica que er. 
contrario a los principios religiosos de los cuáqueros 
de aquellos tiempos «mentir» pidiendo un trato me 
jor del que ya estarían dispuestos a aceptar. Por lo 
tanto, eran negociadores exitosos, porque se sabiu 
que su primera oferta sería su oferta final. Pero ¿que 
pasaría si su oponente intentara adoptar la misma 
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táctica de compromiso? La guerra es la consecuencia 
habitual de que dos naciones dejen de lado la racio- 
nalidad de este modo. 

Nada de esto tiene por qué implicar que la justicia 
sea, de un modo u otro, irracional. Por el contrario, 
me parece que es la más importante de las conven- 
ciones que los humanos emplean para resolver los 
problemas de selección de equilibrios en los jue- 
gos de coordinación cotidianos. No obstante, en lu- 
gar de considerar la justicia como un sustituto para 
los compromisos alcanzados mediante la negocia- 
ción racional, la Teoría de la justicia de John Rawls 
convierte la negociación racional en la primera pie- 
dra de su definición de un resultado justo. Rawls 
identifica un trato justo con el acuerdo que alcanza- 
rían Alice y Bob si fueran a negociar tras un «velo de 
ignorancia» que ocultara su identidad durante la 
negociación. Por lo tanto, ni Alice ni Bob querrían 
poner a nadie en desventaja, porque ellos mismos 
podrían resultar la parte que sufriera la desventaja. 

He dedicado una parte sustancial de mi vida a 
usar la teoría de juegos para analizar las implicacio- 
nes de la definición de Rawls. ¿Por qué nos sorpren- 
de por ser razonable? ¿Lleva a un resultado utilitaris- 
ta como afirma Harsanyi o a un resultado igualitario 
como afirma Rawls? En todo caso, la vida es dema- 
siado corta para explicar por qué creo que Rawls de- 
fendía una institución sólida con un argumento 
equivocado. 
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Formación de coaliciones 


¿Cómo puede aplicarse lo que hemos aprendido so- 
bre el modo de negociar de dos personas racionales 
a la negociación que tiene lugar cuando se forman 
coaliciones? Von Neumann y Morgenstern propu- 
sieron el modelo básico más simple en el que las coa- 
liciones son relevantes. 

Alice, Bob y Carol van a jugar a Divide el dólar. 
Qué va a conseguir cada uno se determina por ma- 
yoría de votos. Por lo tanto, cualquier coalición en- 
tre dos jugadores puede disponer del dólar como és- 
tos deseen. Pero ¿qué coalición se formará?, ¿quién 
se quedará descolgado?, ¿cómo se dividirá el dólar? 


Opción externa 


La opción externa de Alice cuando negocia con Bob 
consiste en lo máximo que puede conseguir en otro 
lado si las negociaciones se rompen del todo. Los 
economistas siguen cometiendo el error de identifi 
car los pagos del statu quo con los de las opciones 
externas de los jugadores cuando usan la solución 
negociadora de Nash para calcular el resultado de 
las negociaciones salariales, Por ejemplo, si Bob se va 
a quedar sin empleo si no llega a un acuerdo con Ali 
ce, se considera que su pago statu quo es el nivel de 
prestaciones sociales. 

Para entender por qué suele ser un error emplea: 
la solución negociadora de Nash de este modo, es nc 
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cesario modificar el modelo de negociación de Ru- 
binstein de modo que Alice y Bob siempre tengan la 
oportunidad de elegir la opción externa tras rechazar 
una oferta. En ese caso se hace evidente que las op- 
ciones externas son relevantes para el resultado de la 
negociación sólo en la medida en que debamos des- 
cartar todos los pares de pagos del conjunto de 
acuerdos que le asignen a alguien menos de lo que le 
ofrece su opción externa. El statu quo debe identifi- 
carse con los pagos que los jugadores reciben durante 
la negociación. Por ejemplo, si Alice y Bob quieren 
negociar el fin de una huelga, sus pagos del statu quo 
son los de sus respectivos ingresos durante la huelga. 
Para que fuera correcto identificar los pagos del 
statu quo con las opciones externas de los jugadores, 
cualquier ruptura de las negociaciones debe ser for- 
zada en lugar de voluntaria. Para modelizar una rup- 
tura tan forzada del modelo de Rubinstein, puede in- 
troducirse un movimiento aleatorio que ponga fin a 
las negociaciones con una probabilidad pequeña des- 
pués de cada desacuerdo. Ello se correspondería con 
el caso en que cualquier demora en alcanzar el acuer- 
do pudiera resultar en que el excedente por el que ne- 
gocian Alice y Bob fuera robado por un tercero. 


El Excluido 


Nuestra versión para tres jugadores de Divide el dó- 
lar puede considerarse como tres problemas de ne- 
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gociación de dos jugadores a los que podemos apli- 
car la teoría de negociación cooperativa de Nash. 
Cuando dos jugadores negocian sobre cómo dividir 
el dólar si llegaran a acordar la formación de una 
coalición sobre cómo votar, sus opciones externas 
son los acuerdos que tomarían si cada uno tuviera 
que negociar con el jugador excluido en lugar de con 
su actual oponente. 

De ello se deduce que Alice debe esperar el mis- 
mo pago si tiene éxito en la formación de una coali- 
ción con Bob que si tuviera éxito en la formación de 
una coalición con Carol —de otro modo uno de los 
acuerdos potenciales le exigiría aceptar una canti- 
dad menor que su opción externa—. Junto al teorema 
de Coase, este hecho determina los tres acuerdos po- 
sibles. En el caso en el que todos los jugadores sean 
neutrales al riesgo, llegamos a la nada sorprendente 
conclusión de que la coalición que se forma dividirá 
el dólar al 50% y dejará al excluido sin nada. 

La simetría del problema hace imposible decir cuál 
de las tres posibles coaliciones se formará. No obstan- 
te, el siguiente modelo no cooperativo rompe la si- 
metría al requerir que Alice, Bob y Carol roten a la 
hora de hacer demandas de pagos. Cuando es tu tur- 
no de juego, puedes aceptar cualquier demanda que 
se haya realizado anteriormente o bien expresar otra 
demanda propia. El único equilibrio de perfección en 
el subjuego predice que Alice y Bob aprovecharán la 
primera oportunidad de formar una coalición. Para 
que su reparto del dólar se aproxime a nuestra pre- 
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dicción cooperativa, el intervalo de tiempo entre de- 
mandas sucesivas tiene que ser muy pequeño. 


Núcleo 


¿Qué puede decirse de la formación de coaliciones 
en situaciones más generales? Una propuesta llama- 
ría a rechazar el perfil de pagos como el resultado de 
una posible solución si alguna coalición puede po- 
ner objeciones a este perfil de pagos porque es capaz 
de imponer otro alternativo que todos sus miem- 
bros prefieren. El conjunto de todos los perfiles de 
pagos a los que no se puede poner objeciones se de- 
nomina núcleo de un juego cooperativo. 

A los economistas les gusta la idea porque el nú- 
cleo de un juego de mercado lo suficientemente 
grande se aproxima a lo que pasaría si compradores 
y vendedores comerciaran a unos precios que iguala- 
ran oferta y demanda. No obstante, aplicar la idea al 
Excluido en el caso en que todos los jugadores sean 
neutrales al riesgo no es demasiado esperanzador. 

Hemos observado que una solución posible al Ex- 
cluido consiste en que Alice y Bob formen una coali- 
ción con el acuerdo de que votarán a favor de dividir 
el dólar, de modo que cada uno consiga 50 centavos. 
Pero este resultado no puede estar en el núcleo, por- 
que Bob y Carol pueden objetar que ellos pueden 
imponer un resultado que ambos prefieren, y que 
consiste en dividir el dólar de modo que Bob consiga 
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51 centavos y Carol 49. Dado que puede emplearse 
un razonamiento similar para excluir cualquier per- 
fil de pagos, sea como sea, el núcleo del Juego del Eli- 
minado se encuentra vacío. 


La paradoja de Condorcet 


El marqués de Condorcet era un idealista revolucio- 
nario francés que descubrió un problema similar 
cuando exploraba posibles sistemas de votación. 

S1 Alice y Bob forman una coalición que deje a 
Carol en desventaja, ésta ofrecerá a todo aquel que 
esté dispuesto a escucharla un poco más de lo que en 
esos momentos obtiene. Si Bob acepta la oferta de 
Carol y abandona a Alice, Alice se convertirá en la 
parte en desventaja y tendrá incentivos para ofrecer- 
le a Carol un poco más de lo que consigue en ese 
momento. Si Carol acepta, Bob tentará a Alice. Y así 
sucesivamente. 

En la vida real, los resultados pueden ser devas- 
tadores. Por ejemplo, la frontera entre Inglaterra y 
Gales, donde vivo, fue un campo de batalla durante 
siglos. Los poderosos señores del lado inglés guar- 
daban la frontera o marchaban contra las incursio- 
nes de las tribus galesas, pero en realidad la guerra 
era continua, puesto que los galeses, el rey de Ingla- 
terra y el señor fronterizo local cambiaban de alian- 
za para unirse contra aquel de los tres que en aquel 
momento fuera más poderoso. 
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La vida de Condorcet no resultó en absoluto me- 
jor que la de las víctimas de los inestables sistemas 
sociales que fue capaz de identificar. Tenía la espe- 
ranza de crear una utopía mediante el razonamiento 
matemático, pero en lugar de ello lo condenaron a la 
guillotina. 


Conjuntos estables 


Von Neumann y Morgenstern entendieron que no 
sería inteligente que Bob escuchara a Carol en el Jue- 
go del Fxcluido cuando ella le explica que puede 
conseguir 51 centavos si se une a ella en coalición en 
lugar de los 50 centavos que le ha prometido Alice. Si 
es una buena idea dejar de lado a Alice cuando Carol 
le tienta, será una buena idea que Carol lo deje de 
lado cuando a ella la tiente Alice. 

Para plasmar esta idea, Von Neumann y Morgens- 
tern se inventaron un concepto que en la actualidad 
se conoce como conjunto estable. Sostenían que de- 
berían pasarse por alto las objeciones que en sí mis- 
mas no constituyeran una posible solución; todo lo 
que quede fuera del conjunto estable queda excluido 
porque puede encontrarse una objeción que perte- 
nezca al conjunto estable, mientras que lo que quede 
dentro del conjunto estable sólo necesita ser inmune 
a otras objeciones pertenecientes al conjunto estable. 

El principal ejemplo se encuentra en el Juego del 
Eliminado, cuando todos los jugadores son neutra- 
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les al riesgo. Un conjunto estable consiste en tres re- 
sultados posibles, en los cuales el dólar se divide 
equitativamente entre dos de los jugadores. Sin em- 
bargo, hay muchos otros conjuntos estables. Por 
ejemplo, el conjunto de todos los resultados en los 
cuales Carol consigue 25 céntimos y el resto del dó- 
lar se divide de cualquiera de los modos posibles en- 
tre Alice y Bob es estable. 

No es fácil explicar estos nuevos conjuntos esta- 
bles. Otros teóricos de los juegos están en desacuer- 
do, pero creo que su aparición sólo muestra que la 
idea de un conjunto estable no es lo suficientemente 
precisa. Así que en ocasiones existen demasiados 
conjuntos estables, aunque éste es el menor de nues- 
tros problemas. William Lucas encontró un juego 
cooperativo con muchos jugadores que carece por 
completo de conjuntos estables, así que también 
puede haber un número demasiado bajo de conjun- 
tos estables. 


El valor de Shapley 


Una vez me convocaron con urgencia a Londres 
para explicar de qué hablaba el gobierno francés 
cuando sugirió que el coste del túnel propuesto 
bajo el Canal de la Mancha se asignara a los países 
de la Unión Europea mediante el valor de Shapley. 
Se refería a Lloyd Shapley, otro miembro del bri- 
llante grupo de quienes preparaban el doctorado y 
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estudiaron matemáticas junto a John Nash en Prin- 
ceton. 

Shapley siguió el ejemplo de Nash y propuso un 
conjunto de supuestos que define una única predic- 
ción para el resultado de un juego cooperativo. Sin 
embargo, a diferencia de Nash, sus supuestos no se 
aplican únicamente a juegos de negociación de sólo 
dos jugadores, sino a cualquier juego cooperativo 
con «utilidad transferible». El principal caso de inte- 
rés tiene lugar cuando todos los jugadores son neu- 
trales al riesgo y los pagos se miden en dólares. En 
ese caso podría sostenerse que lo único que importa 
de una coalición es lo que yo llamaría «valor de la 
coalición», es decir, el máximo número de dólares 
cuya disponibilidad para repartir entre sus miem- 
bros pueda garantizar. Estos pagos incluyen todos 
los «pagos compensatorios» necesarios para com- 
prar la lealtad de cualquier miembro de la coalición 
que pueda pensar que estaría mejor en otro lado. 

Por ejemplo, en el Excluido, el valor de cada coali- 
ción con dos jugadores es de un dólar. El valor de 
una gran coalición de los tres jugadores también es 
de un dólar. El valor de una coalición de un solo 
miembro es cero. Las coaliciones vacías sin jugado- 
res también tienen un valor de cero. 

La forma más fácil de encontrar el valor de Sha- 
pley deja claro que está pensado como una media de 
todas las posibles configuraciones en la formación 
de coaliciones. Se empieza con una coalición vacía y 
se añaden jugadores hasta que se llega a la gran coa- 
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lición. Cuando Alice se une a la coalición, se anota su 
contribución marginal a la coalición: el valor en el 
cual su inclusión incrementa el valor de la coalición. 
Los pagos asignados a Alice por el valor de Shapley 
consisten, entonces, en la media de todas sus contri- 
buciones marginales, tomadas de todas las maneras 
en que es posible reunir una gran coalición jugador 
a Jugador. 

El Juego del Excluido tiene tres jugadores y, por 
consiguiente, hay seis maneras de ordenar a los juga- 
dores: ABC, ACB, BAC, BCA, CAB y CBA. Las con- 
tribuciones marginales son, respectivamente: 0, 0, 1, 
0, 1,0. Así que el valor de Shapley le asigna a Alice un 
pago de 1/3 de dólar, que equivale a lo que afirmába- 
mos que obtendría de media en el apartado anterior 
sobre coaliciones. 

¿En qué medida resulta útil el valor de Shapley? 
Creo que no hay duda de su relevancia para ejerci- 
cios sobre la distribución de costes del tipo propues- 
to por el gobierno francés, pero no funciona dema- 
siado bien cuando se pone a prueba con el programa 
de Nash. Como muchas otras cosas de la teoría de 
juegos, todavía no hemos llegado a comprender 
buena parte de lo referente a la formación de coali- 
ciones. 


10. Rompecabezas y paradojas 


Los fenómenos que se retroalimentan y la intuición 
humana son compañeros de viaje incómodos. Por 
consiguiente, no resulta sorprendente que cuando a 
la gente no le gusta adónde le conduce un argumen- 
to de equilibrio invente argumentos más simples 
que la lleven a conclusiones más digeribles. No obs- 
tante, el primer principio del pensamiento racional 
consiste en no dejar nunca que tus preferencias in- 
fluyan en tus creencias. 


Falacias del Dilema del Prisionero 


Se dice que el hecho de que ambos jugadores estu- 
vieran mejor si no jugaran sus estrategias de equili- 
brio en el Dilema del Prisionero es una paradoja de 
la racionalidad que necesita ser resuelta. 
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El imperativo categórico 


En términos coloquiales, el imperativo categórico de 
Immanuel Kant establece que es racional hacer lo 
que te gustaría que todo el mundo hiciera. Si fuera 
cierto, sería racional cooperar en el Dilema del Pri- 
sionero. Pero hacerse ilusiones nunca es racional. 
Para mí, constituye una fuente constante de sorpresa 
que a Kant nunca se le hayan pedido cuentas por 
proponer un principio de racionalidad sin ofrecer 
ninguna razón para tomarlo en serio. 


La falacia de los gemelos 


Dos personas racionales que afrontan el mismo pro- 
blema necesariamente optarán por idéntica acción. 
Así que en el Dilema del Prisionero Alice y Bob juga- 
rán halcón los dos o paloma los dos. Dado que Alice 
prefiere el resultado (paloma, paloma) a (halcón, 
halcón), debería elegir paloma. 

La falacia resulta atractiva porque sería correcta si 
Alice y Bob fueran gemelos genéticamente idénticos 
y estuviéramos hablando sobre qué comportamien- 
to genéticamente determinado es mejor para la ap- 
titud biológica (véase la «Selección por parentesco» 
en el Capítulo 8). Pero en ese caso, el juego relevante 
no sería el Dilema del Prisionero: se trataría de un 
juego con un solo jugador. 

Como es común cuando se analizan las falacias 
del Dilema del Prisionero, se nos ofrece un análisis 
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correcto del juego equivocado. El Dilema del Prisio- 
nero es un juego de dos jugadores en el cual Alice y 
Bob eligen sus estrategias de modo independiente. La 
falacia de los gemelos supone incorrectamente que 
Bob tomará la misma decisión que Alice, sea cual sea 
la estrategia de ésta. Esto no puede ser cierto, puesto 
que supuestamente Bob es racional y una de sus dos 
posibles acciones es irracional. 

Pueden modificarse los supuestos de la falacia de 
modo que las estrategias de Alice y Bob coincidan 
solamente con una probabilidad suficientemente 
alta. La historia que se explica para justificar una co- 
rrelación tal en sus comportamientos a menudo le- 
vanta el suficiente polvo para ocultar el hecho de que 
cualquier tipo de correlación comporta que Alice y 
Bob no están decidiendo de manera independiente. 
Sin embargo, si no deciden independientemente, no 
juegan al Dilema del Prisionero. Aunque la informa- 
ción de Alice y Bob estuviera correlacionada -según 
se establece como hipótesis en el concepto de equili- 
brio correlacionado de Aumann-, seguirían sin ele- 
gir halcón, ya que halcón se encuentra fuertemente 
dominada, independientemente de lo que los juga- 
dores puedan aprender sobre otras cuestiones. 


El mito del voto malgastado 


Una versión de la falacia de los gemelos se saca a re- 
lucir periódicamente en tiempo de elecciones, cuan- 
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do los entendidos afirman que «cada voto cuenta» 
(véase «Equilibrio de Nash mixto», Capítulo 2). Si 
un voto malgastado es aquel que no influye en el re- 
sultado de las lecciones, el único momento en el que 
un voto puede influir es cuando sólo un voto separa 
al ganador del segundo. Si están separados por dos 
votos o más, un cambio en tu voto no cambiaría en 
absoluto quién sale elegido. No obstante, unas elec- 
ciones a un escaño de la asamblea nacional casi nun- 
ca se deciden por un solo voto. 

A continuación se presenta un ejemplo hipotéti- 
co de elecciones todavía más reñidas que la competi- 
ción electoral real entre Bush y Gore en Estados Uni- 
dos en 2000. Una encuesta de opinión fiable afirma 
que los votantes de un estado con un papel crucial 
en las elecciones, y que ya han tomado una decisión, 
se dividen 51% contra 49% a favor de Bush. La pro- 
babilidad de que un votante indeciso se decida por 
Bush es por sí sola suficiente para asegurar que éste 
batirá a Gore por una media de 500 votos. La cosa 
parece tan reñida que Alice decide votar. ¿Qué pro- 
babilidad hay de que su voto cuente, es decir, de que 
el resultado sea distinto que si se hubiera quedado 
en casa viendo la televisión? 

Con un millón de votantes, el 5% de los cuales 
son indecisos, el voto de Alice contaría solamente 
una vez cada 8.000 años, aunque las mismas cir- 
cunstancias excepcionales se repitieran cada cuatro 
años. Pero no lo harán. Las posibilidades de que los 
votos emitidos por los indecisos prácticamente equi- 
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libren los votos de los que se han decidido son infi- 
nitesimales. Si los indecisos de nuestro ejemplo vo- 
taran a Bush con la misma frecuencia que el resto de 
la población, el voto de Alice solamene tendría rele- 
vancia una vez cada 20 trillones de años. ¡No es nin- 
gún milagro que en las elecciones presidenciales 
ningún estado se haya decidido jamás por un solo 
voto! 

La gente inocente se imagina que aceptar este ar- 
gumento supone precipitar el desmoronamiento de 
la democracia. Por consiguiente, se nos dice que es- 
tamos equivocados por contar solamente el efecto 
de nuestro único voto individual —en lugar de ello 
deberías contar el número total de votos emitidos 
por todas aquellas personas que piensan y sienten 
como tú piensas y sientes y que, por consiguiente, 
votarían como tú—. Si tienes 10.000 de estas almas 
gemelas, tu voto ya no sería desperdiciado, porque la 
probabilidad de que unas elecciones se decidan por 
un margen de 10.000 votos o menos a menudo es 
muy alta. Este argumento falla por la misma razón 
que la falacia de los gemelos falla en el Dilema del 
Prisionero: puede haber un gran número de perso- 
nas que piensen y sientan como tú, pero su decisión 
de salir de casa y votar no cambiará si te quedas en 
casa viendo la televisión. 

A veces los detractores acusan a los teóricos de los 
Juegos de falta de espíritu público al exponer esta fa- 
lacia, pero se equivocan al pensar que la democracia 
se vendría abajo si se animara a la gente a pensar so- 
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bre la realidad del proceso electoral. Animar en un 
partido de fútbol es una analogía útil. Pocos gritos 
de ánimo se darían si lo que la gente intentara hacer 
al gritar fuera incrementar el nivel general de ruido 
en el estadio; una sola voz, sea la que sea, no puede 
marcar una diferencia significativa en el ruido que se 
hace cuando una multitud grita. Pero nadie grita 
para incrementar el nivel general de ruido; le gritan 
palabras de consejo y aliento a su equipo aun cuan- 
do están en casa frente a un televisor. 

Lo mismo se aplica al voto. Te estás engañando si 
votas porque tu voto tiene una probabilidad signifi- 
cativa de resultar clave. Pero tiene todo el sentido vo- 
tar por la misma razón que los aficionados al fútbol 
le gritan consejos a sus equipos. Asimismo, como es 
más satisfactorio gritar consejos buenos en lugar de 
malos, son muchos los teóricos de los juegos que 
creen que puedes sacar más de participar en unas 
elecciones si votas como si fueras el votante crucial, 
aunque sepas que la probabilidad de que un voto 
marque la diferencia es demasiado pequeña para ser 
significativa. Un kantiano supondría que todo el 
mundo es estratégico de un modo similar, pero yo 
prefiero usar las encuestas de opinión para adivinar la 
forma más probable de que se produzca un empate. 

Por ejemplo, Ralph Nader era el candidato ecolo- 
gista a las elecciones presidenciales en las que Bush 
venció a Gore. Le doy mucha importancia a los te- 
mas ecológicos, pero no habría votado a Nader por- 
que, si hubiera habido un empate, se habría produ- 
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cido, casi con total seguridad, entre Bush y Gore. En 
Europa, un voto estratégico de este tipo resultará en 
ocasiones en el voto a un partido menor. Los mis- 
mos entendidos que te dicen que cada voto cuenta te 
dirán que un voto estratégico como ése es un voto 
malgastado. ¡O una cosa o la otra, que se decidan! 


La falacia de la disposición transparente 


Esta falacia nos pide que nos creamos dos proposi- 
ciones dudosas. La primera es que los individuos ra- 
cionales tienen la fuerza de voluntad para compro- 
meterse de antemano a participar en los juegos de 
un modo determinado. La segunda establece que 
otras personas pueden interpretar nuestro lenguaje 
corporal tan bien como para saber cuándo decimos 
la verdad. Por consiguiente, si afirmamos con since- 
ridad que hemos adquirido un compromiso irrevo- 
cable, nos creerán. 

Si estas proposiciones fueran correctas, ¡seguro 
que nuestro mundo sería muy distinto! La Expresión 
de las emociones de Charles Darwin se equivocaría al 
negar que nuestros músculos faciales involuntarios 
hacían imposible esconder nuestro estado emocional 
y, por lo tanto, los actores se quedarían sin trabajo, 
los políticos serían incorruptibles, no se podría jugar 
al Póquer, la racionalidad serviría de defensa contra 
la adicción a las drogas. No obstante, la lógica de la 
teoría de juegos seguiría aplicándose. 
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Como ejemplo, analicemos dos disposiciones 
mentales posibles llamadas CLINT y JOHN. La pri- 
mera es una «estrategia vengadora», así llamada por 
el personaje representado por Clint Eastwood en los 
spaghetti westerns (véase la «Evolución de la coope- 
ración», Capítulo 8). La segunda conmemora una 
película divertidísima que vi una vez, en la cual John 
Wayne representaba el personaje de Genghis Khan. 
Elegir la disposición JOHN supone manifestar que te 
has comprometido a elegir halcón en el Dilema del 
Prisionero en toda circunstancia. Elegir la disposi- 
ción CLINT supone manifestar que te comprometes 
a jugar paloma en el Dilema del Prisionero sólo y 
únicamente si tu oponente manifiesta el mismo 
compromiso. Si no, eliges halcón. 

Si se permite a Alice y Bob que se comprometan 
transparentemente con una de estas disposiciones, 
ya no jugarán al Dilema del Prisionero; jugarán al 
Juego de las Estrellas de Cine de la Figura 34, en el 
cual las estrategias de los jugadores son CLINT y 
JOHN. Si ambos jugadores eligen CLINT en el Juego 
de las Estrellas de Cine, se comprometen a elegir pa- 
loma en el Dilema del Prisionero; si no, se compro- 
meten a elegir halcón. 

Como muestran los pagos rodeados con círculos, 
CLINT es una estrategia (débilmente) dominante en 
el Juego de las Estrellas de Cine. Así que si tanto Ali- 
ce como Bob eligen CLINT, se situarán en un equili- 
brio de Nash que resulta en la cooperación en el Di- 
lema del Prisionero. Los defensores de la falacia de 
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Juego de las Estrellas de Cine 


FIGURA 34. Falacia de la disposición transparente. 


la disposición transparente creen que esto demues- 
tra que la cooperación es racional en el Dilema del 
Prisionero. Si tuvieran razón, sería bonito que en 
la vida real todos los juegos fueran realmente un 
Juego de la Estrella de Cine de algún tipo —especial- 
mente si se pudiera escoger ser Adam Smith o 
Charles Darwin en lugar de John Wayne o Clint 
Eastwood-. Pero incluso en ese caso, no se podría 
deducir que la racionalidad exige cooperar en el Di- 
lema del Prisionero. El argumento sólo demuestra 
que es racional elegir CLINT en el Juego de las Estre- 
llas de Cine. 


La paradoja de Newcomb 
Hay dos cajas que posiblemente tengan dinero en su 


interior. Alice es libre de tomar la primera caja o las 
dos. S1 sólo le importa el dinero, ¿qué debería hacer? 
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Parece un problema fácil. Si paloma representa tomar 
solamente la primera caja y halcón tomar ambas, Ali- 
ce debería escoger halcón porque en ese caso consi- 
gue, como mínimo, tanto dinero como con paloma. 

No obstante, hay una trampa. Es seguro que la se- 
gunda caja contiene un dólar. La primera caja con- 
tiene o bien dos dólares o nada. La decisión de si de- 
bería haber dinero en la primera caja le corresponde 
a Bob, que conoce tan bien a Alice que siempre es 
capaz de predecir perfectamente lo que ella hará. 
Como Alice, tiene dos posibilidades, paloma y hal- 
cón. Para él, paloma significa meter dos dólares en la 
primera caja. Su otra posibilidad, halcón, consiste en 
no meter nada en la primera caja. Su motivación es 
pillar a Alice en falta. Por consiguiente, jugará palo- 
ma si predice que Alice elegirá paloma; jugará halcón 
si predice que jugará halcón. 

Así que elegir halcón ya no parece tan ventajoso 
para Alice. Si elige halcón, Bob predice su elección y 
no mete nada en la primera caja, así que Alice sólo 
consigue el único dólar de la segunda caja. Pero si 
Alice elige paloma, Bob predecirá su decisión y pon- 
drá dos dólares en la primera caja para que Alice los 
tome. 

El filósofo de Harvard Robert Nozick creó una 
moda en su profesión (acertadamente descrita 
como «newcombmanía») al afirmar que la paradoja 
de Newcomb demuestra que a veces puedes maxi- 
mizar tus pagos decidiéndote por una estrategia 
fuertemente dominada. También podría haber ar- 
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Alice juega antes Bob no conoce el movimiento de Alice 


FIGURA 35. Dos intentos de satisfacer los requisitos de New- 
comb. El conjunto de información del juego de la derecha indi- 
ca que Alice no conoce la predicción de Bob. Las tablas de pagos 
de debajo de cada árbol de decisión son las formas estratégicas 
relevantes. 


gumentado igualmente que ello demuestra que 
2 +2= 5, ya que de una contradicción puede dedu- 
cirse cualquier cosa. La contradicción de la paradoja 
de Newcomb consiste en suponer la existencia de un 
Juego en el cual: 


1. Alice mueve después de Bob. 
2. Bob conoce la acción de Alice. 
3. Alice dispone de más de una acción. 


La Figura 35 muestra dos intentos de crear un 
juego como ése sin ser concretos sobre los pagos de 


256 LA BORIA DE JUEGOS, UNA BREVE IN PRODUCCION 


Bob; el juego de la izquierda no cumple con el pri- 
mer componente de la lista, y el de la derecha no 
cumple con el punto 2. Podemos satisfacer tanto el 
criterio 1 como el 2 si le ofrecemos a Alice sólo una 
opción en el juego de la derecha, pero entonces se 
incumpliría el punto 3. 

Cuando defiende que Alice debe jugar paloma 
para maximizar sus pagos, Nozick da por hecho que 
Bob jugará p h en el juego de la izquierda. Esto quie- 
re decir que Bob predecirá p cuando Alice juegue p, 
y h cuando ella juegue h. No obstante, para Alice, en 
el juego de la izquierda, h no es una estrategia domi- 
nada. Para defender que la estrategia h de Alice en el 
juego de la izquierda está dominada, debe apelarse 
al juego de la derecha. No obstante, no resulta para- 
dójico que Alice pueda jugar de un modo distinto en 
juegos distintos. 

Pueden enturbiarse las aguas abandonando el re- 
quisito de que Bob puede predecir a la perfección el 
comportamiento de Alice. En ese caso, puede crear- 
se un juego en el que los tres requisitos de la parado- 
ja de Newcomb se satisfagan mediante la introduc- 
ción de jugadas aleatorias en el juego de la derecha 
que le arrebaten a Alice la oportunidad de elegir dis- 
tinto que Bob en algunos momentos. Pero por mu- 
chos juegos de manos que se hagan con los paráme- 
tros, no se puede hacer que resulte óptimo al elegir 
una estrategia fuertemente dominada. 
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La paradoja del examen sorpresa 


La subasta de telecomunicaciones británica que re- 
caudó 35.000 millones de dólares se ha mencionado 
en varias ocasiones. Todo el mundo se sorprendió 
por esta cantidad enorme —excepto los expertos de 
los medios, que finalmente acabaron acercándose a 
la cifra correcta prediciendo un número más alto 
cada vez que las pujas de la subasta contradecían su 
predicción anterior—. Todo el mundo puede obser- 
var el fraude contra el público perpetrado por los 
expertos de los medios de comunicación en este 
caso, pero el fraude no se detecta con tanta facilidad 
cuando aparece en una de las muchas versiones de la 
paradoja del examen sorpresa, a través de la cual 
mucha gente aprende por primera vez acerca de la 
retroinducción. 

Alice es una profesora que le explica a su clase que 
va a ponerles un examen la semana que viene, pero 
que el día en que va a hacerse será sorpresa. Bob es 
un alumno que analiza mediante la retroinducción 
los días de la semana siguiente. Si Alice no les ha 
puesto el examen cuando hayan acabado las clases 
del jueves, Bob supone que entonces no tendrá otra 
opción que ponerlo el viernes, ya que es el último día 
de la semana lectiva. Así que si el examen se hiciera el 
viernes, a Bob no le sorprendería. Por consiguiente, 
Bob deduce que Alice no puede planear poner el 
examen el viernes. Pero ello significa que el examen 
tendrá que llevarse a cabo el lunes, el martes, el miér- 
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coles o el jueves. Llegado a esta conclusión, Bob apli- 
ca el argumento de la retroinducción de nuevo para 
eliminar el jueves como día posible para el examen. 
Una vez eliminado el jueves, se encuentra en posi- 
ción de eliminar el miércoles. Una vez ha eliminado 
todos los días de la semana lectiva con este método, 
respira aliviado y no hace ademán alguno de estu- 
diar durante el fin de semana. ¡Pero entonces Alice lo 
pilla por sorpresa cuando pone el examen a primera 
hora de la mañana del lunes! 

En realidad no se trata en absoluto de una parado- 
ja, porque Bob no debería haber respirado con alivio 
tan pronto. Si el argumento de la retroinducción es 
correcto, las dos afirmaciones de Alice son incoheren- 
tes y, por lo tanto, al menos una de ellas debe ser inco- 
rrecta. Pero ¿por qué debería Bob suponer que la afir- 
mación incorrecta es que se pondrá un examen y no 
que el examen será una sorpresa? Esta observación 
suele dejarse de lado, porque en realidad lo que quiere 
oír la gente es si el argumento de la retroinducción es 
correcto. Pero lo que tendrían que preguntar es si la 
retroinducción se ha aplicado al juego adecuado. 

En el juego que la gente cree que se está analizan- 
do, Alice elige uno de los cinco días para poner el 
examen y Bob predice por qué día se decidirá. Si la 
predicción es errónea, Bob se verá sorprendido. La 
solución de esta versión del Juego de las Monedas es 
que tanto Alice como Bob eligen cada día con la mis- 
ma probabilidad. Bob se ve sorprendido cuatro de 
cada cinco veces. 
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Ésta no es la conclusión a la que llegamos antes, 
porque la paradoja del examen sorpresa aplica la re- 
troinducción a un juego en el que a Bob siempre se 
le permite predecir que el examen tendrá lugar ese 
mismo día, aunque habría podido predecir errónea- 
mente que iba a tener lugar el día anterior. En este 
extraño juego, la estrategia óptima de Bob consiste 
en predecir lunes el lunes, martes el martes, miérco- 
les el miércoles, jueves el jueves y viernes el viernes. 
¡No es raro que Bob nunca se vea sorprendido por- 
que el examen se realice en un día que no predijo! 

La paradoja del examen sorpresa ha circulado 
desde hace tanto tiempo como puedo recordar. Oca- 
sionalmente, vuelve a airearse en periódicos y revis- 
tas. Siempre ha sido objeto de sesudos artículos en 
revistas de filosofía. La confusión sigue existiendo 
porque la gente no responde a las preguntas perti- 
nentes. Una de las principales virtudes de adoptar 
un razonamiento formal sistemático en la teoría de 
juegos es que hacerse las preguntas necesarias se tor- 
na automático. Entonces no es necesario ser un ge- 
nio como Von Neumann para seguir el camino ade- 
cuado. Su formalismo piensa por ti. 


De todos sabido 
¿Por qué le damos tanta importancia al contacto vi- 


sual? Creo que la razón es que algo se convierte en 
sabido por todos solamente si tiene lugar un aconte- 
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cimiento que implica que no podría haber ocurrido 
sin que todo el mundo lo supiera. Por ejemplo, si 
Alice y Bob se miran el uno al otro al observar que 
Carol tiene la cara sucia, entre ellos se sabrá que Ca- 
rol tiene la cara sucia. Análogamente, cuando dos 
personas se miran a la cara, se convierte en algo sa- 
bido por ambos, que son conscientes de la existencia 
del otro como individuo. 


Tres damas de edad 


Alice, Beatrice y Carol son tres respetables damas 
que se encuentran en la feria de un condado del Me- 
dio Oeste de los Estados Unidos. Cada una de las tres 
tiene la cara sucia, pero ninguna se pone colorada de 
vergüenza, aunque una dama respetable consciente 
de que tiene la cara sucia en público seguramente lo 
haría. Se deduce que ninguna de las señoras sabe que 
tiene la cara sucia, aunque puede ver con claridad las 
caras sucias de las otras. 

Los clérigos del Medio Oeste siempre dicen la ver- 
dad y, por lo tanto, las damas prestan mucha aten- 
ción cuando un pastor del lugar anuncia que una de 
ellas tiene la cara sucia. Tras este anuncio, una de las 
damas se sonroja. ¿Cómo es eso? ¿No les había dicho 
el pastor algo que ya sabían? 

Para entender lo que el clerigo añadió a lo que las 
damas ya sabían, debemos analizar la cadena de ra- 
zonamientos que lleva a la conclusión de que al me- 
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FIGURA 36. Tres damas del Medio Oeste. 


nos una de las damas debe sonrojarse. Si ni Beatrice 
ni Carol se sonrojan, Alice razonaría del modo si- 
guiente: 


Alice: Supongamos que mi cara estuviera limpia. En- 
tonces Beatrice razonaría del modo siguiente: 

Beatrice: Veo que la cara de Alice está limpia. Supongo 
que la mía también lo está. Entonces Carol ra- 
zonaría del modo siguiente: 

Carol: Veo que las caras de Alice y Beatrice están lim- 
pias. Si mi cara estuviera limpia, nadie tendría 
la cara sucia. Pero el anuncio del pastor de- 
muestra lo contrario. Así que mi cara está sucia 
y debo sonrojarme. 

Beatrice: Como Carol no se ha sonrojado, mi cara está 
sucia. Así que debo sonrojarme. 

Alice: Como Beatrice no se ha sonrojado, mi cara está 
sucia. Así que debo sonrojarme. 
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Por lo tanto, ¿qué añadió el pastor a lo que sabían 
las damas? Para que el razonamiento de Alice fun- 
cionara, necesitaba saber que Beatrice sabe que Ca- 
rol sabe que Alice y Beatrice saben que alguien tiene 
la cara sucia. Todo este saber sólo es posible cuando 
el pastor pone en conocimiento de todos que al- 
guien tiene la cara sucia. Entonces no sólo es cierto 
que Alice, Beatrice y Carol saben que una de ellas 
tiene la cara sucia; todas saben que todas saben que 
todas saben que todas lo saben. 


Una paradoja de la coordinación 


¿Es necesario tener una barba magnífica para hacer 
progresos en la epistemología interactiva? La única 
prueba que puedo presentar es que el barbudo filó- 
sofo de Princeton David Lewis comparte con el 
igualmente hirsuto Bob Aumann el mérito de haber 
reconocido la importancia de la información cono- 
cida por todos en la teoría de juegos. Sin embargo, 
¿qué vamos a sacar de la afirmación de Lewis de que 
una convención no puede ser operativa a menos 
que sea de todos sabido que los jugadores van a 
usarla? 

Para que algo sea sabido por todos, necesitamos 
un equivalente al clérigo carente de tacto de la his- 
toria de las tres damas del Medio Oeste. Pero nor- 
malmente no puede encontrarse un clérigo como 
ése. Casi ninguna de las convenciones que usamos a 


10. ROMPECABEZAS Y PARADOJAS 263 


diario supera el requisito de Lewis. De modo que, 
¿cómo es que parecen funcionar tan bien? 

Los científicos informáticos, preocupados por las 
implicaciones de los sistemas distribuidos, ilustran 
el problema contando una historia sobre dos gene- 
rales bizantinos que intentan coordinar un ataque 
contra un ejército enemigo que se encuentra en un 
valle entre los dos, pero yo prefiero un ejemplo me- 
nos dramático. 

Alice y Bob quieren quedar mañana en Nueva 
York. Por correo electrónico, Alice sugiere que se en- 
cuentren en la estación Grand Central a mediodía. 
Bob envía un correo electrónico de confirmación. 
Este intercambio sería adecuado para la mayoría de 
nosotros, pero Lewis alegaría que el acuerdo no es 
conocido por todos porque Bob no sabe que Alice 
recibió su confirmación. Por lo tanto, ella debería 
enviarle un correo electrónico para confirmar que la 
recibió. A continuación Bob debería enviar por co- 
rreo electrónico una confirmación de la confirma- 
ción de Alice, y así sucesivamente. Dado que siempre 
existe una pequeña probabilidad de que un mensa- 
je de correo no se reciba, el intento de ponerse de 
acuerdo sobre una convención nunca llegará a ser 
sabido por todos. 

Pero ¿por qué una convención tendría que ser 
conocida por todos para resultar operativa? Ariel 
Rubinstein estudió esta cuestión mediante el análi- 
sis de un nuevo Juego del Correo Electrónico en el 
que el Juego de la Cita se sustituye por el Juego de la 
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Caza del Ciervo del Capítulo 4. La convención por 
defecto consiste en que Alice y Bob juegan paloma 
en el Juego de la Caza del Ciervo, pero de vez en 
cuando las etiquetas de sus dos estrategias se invier- 
ten, de forma que jugar paloma en realidad supon- 
drá que juegan halcón. Sólo Alice se da cuenta de 
que tiene lugar esta inversión. Le envía un correo 
electrónico a Bob diciendo que en este caso debe- 
rían jugar halcón en lugar de paloma. Bob envía au- 
tomáticamente una confirmación. Ella envía auto- 
máticamente una confirmación de la confirmación 
y así sucesivamente. 

Una estrategia del Juego del Correo Electrónico 
establece si se elige halcón o paloma según el número 
de mensajes que ha recibido el jugador. Entonces 
podemos atajar y evitar la cuestión de la informa- 
ción sabida por todos y preguntarnos si existe un 
equilibrio de Nash del Juego del Correo Electrónico 
en el cual Alice y Bob siempre tengan éxito al coor- 
dinar un equilibrio que ambos prefieran en el Juego 
de la Caza del Ciervo. La respuesta de Rubinstein pa- 
rece confirmar la intuición de Lewis. El único equi- 
librio de Nash en el Juego del Correo Electrónico, 
en el cual Alice y Bob juegan paloma cuando no se 
manda ningún mensaje, requiere que siempre jue- 
guen paloma independientemente del número de 
mensajes que reciban. 

Sin embargo, el panorama cambia cuando permi- 
timos a Alice y Bob que elijan si quieren o no enviar 
mensajes. La versión modificada del Juego del Co- 
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rreo Electrónico tiene muchos equilibrios de Nash, 
el más agradable de los cuales requiere que ambos 
jugadores jueguen halcón siempre que Alice pro- 
ponga hacerlo y Bob dé su aprobación —como cuan- 
do los amigos se ponen de acuerdo para encontrarse 
en una cafetería—. Pero hay otros equilibrios de 
Nash en los cuales los jugadores acuerdan jugar hal- 
cón solamente tras un largo intercambio de confir- 
maciones de confirmaciones. Los anfitriones de re- 
finadas cenas formales sufren equilibrios de este 
tipo cuando sus huéspedes empiezan a moverse ha- 
cia la puerta con una lentitud glacial al final de la ve- 
lada, parándose a cada centímetro más o menos 
para que el anfitrión y el invitado puedan asegurar- 
se repetidamente el uno al otro que marcharse a 
esa hora resulta socialmente aceptable para ambas 
partes. 

La conclusión de sentido común es que las con- 
venciones no necesitan ser conocidas por todos para 
funcionar. La mayoría de las convenciones son esta- 
blecidas por las fuerzas de la evolución cultural. En 
ocasiones, las consideraciones relativas a la estabili- 
dad evolutiva hacen posible eliminar algunos equi- 
librios de Nash. En la versión modificada del Juego 
del Correo Electrónico, cabría esperar que las consi- 
deraciones de esta clase eliminaran finalmente los 
equilibrios que generan «largas despedidas» después 
de las cenas formales, pero el pronóstico no resulta 
halagúeño. Irónicamente, tan sólo el equilibrio de 
Rubinstein, en el cual Alice y Bob se inclinan por 
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paloma independientemente de lo que ocurra, es in- 
capaz de superar un examen adecuado de estabili- 
dad evolutiva. 


El Problema de Monty Hall 


Alice participa en el viejo concurso de preguntas que 
presenta Monty Hall. Debe elegir entre tres cajas, de 
las cuales sólo una contiene un premio. Monty sabe 
qué caja contiene el premio, pero Alice no. Después 
de elegir la caja 2, Monty abre una de las otras dos 
cajas que sabe vacía. En ese momento, Alice tiene la 
oportunidad de cambiar de idea y de elegir la otra 
caja, ¿qué debería hacer? 

La gente suele decir que no importa. Según su ra- 
zonamiento, la probabilidad de ganar de Alice cuan- 
do eligió la caja 2 era de 1/3 porque había la misma 
probabilidad de que el premio estuviera en cual- 
quiera de las tres cajas. Cuando se descubre que una 
de las cajas está vacía, la probabilidad de que la caja 2 
contenga el precio asciende hasta Y, porque ahora 
cada una de las dos cajas cerradas tiene la misma po- 
sibilidad de albergar el premio. Si Alice cambia de 
caja, su probabilidad de ganar seguirá siendo de Y». 
Así que, ¿por qué preocuparse de cambiarla? 

Aparentemente, Marilyn Vos Savant tiene el coe- 
ficiente intelectual más alto jamás registrado. Cuan- 
do explicaba en la revista Parade que Alice siempre 
debería cambiar una caja por otra, varios autonom- 
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FIGURA 37. Juego de Monty Hall. Sólo se muestran los pagos de 
Alice. El movimiento aleatorio se muestra como un cuadrado. 
Los conjuntos de información de Alice muestran que desconoce 
qué caja contiene el premio, pero sí sabe qué caja abre Monty. La 
elección de cambiar de caja se destaca con una línea más gruesa. 
La figura muestra que sea cual sea la estrategia de Monty, Alice 
gana con una probabilidad de 2/3 si cambia de caja 


brados gurús de la matemática se rieron de ella con 
desdén, pero tenía razón. 

La probabilidad de que el premio esté en la caja 1 
o en la caja 3 es de 2/3. Si Alice cambia su caja por 
cualquiera de estas dos que siguen cerradas, Alice 
ganará con una probabilidad de 2/3. 

Este argumento es engañosamente cierto. Incluso 
los mejores matemáticos son en ocasiones incapaces 
de entender por qué la acción de Monty le transmite 
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tanta información a Alice. Después de todo, no |. 
habría transmitido ninguna información útil en ab 

soluto si hubiera abierto una caja al azar que resulta 

ra estar vacía. Pero él eligió deliberadamente un. 
caja que sabía vacía. 

No obstante, no hay que tener el mayor coeficien 
te intelectual jamás registrado para obtener la res 
puesta correcta si se está dispuesto a que Von Neu 
mann piense por uno. La Figura 37 muestra el juego 
al que juegan Alice y Monty. Los pagos de Monty no 
importan, pero también podríamos suponer que 
quiere que Alice pierda. En primer lugar, un movi- 
miento aleatorio introduce el premio en una de las 
cajas. A continuación Monty decide si abrir la caja 1 
o la caja 3 (solo tiene una verdadera capacidad de 
elección cuando el premio se encuentra en realidad 
en la caja 2). Entonces Alice decide si se queda con la 
caja 2 o si la cambia por la caja que Monty no ha 
abierto de entre las otras dos (ya sea la caja 1 o la 
caja 3). 

Ahora ya no hace falta pensar nada. Si Alice siem- 
pre cambia, la cifra hace imposible que no se reco- 
nozca que gana cuando el premio está en la caja 1 o 
la caja 3, y pierde cuando está en la caja 2. Por lo tan- 
to, gana con una probabilidad de 2/3. 
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